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ACGGTACGGC AGCTGATAGA GCGGTATACA ATGGTCCaTT TAAAGTTOAT GATTGGAAAC 5280 

AAGAAGATAA AACCTTACTA TCTAAAAATC AGTATTATTG GGATAAAAAG AATGTAAAAT 5340 

TAGATAAAGT GAATTATAAA GTTATTAAAG ACTTACAAGC CGGTGCATCA TTGTATGATA 5400 

CTGAATCAGT AGATGACGCA TTTATTACTG CAGATCAAGT AAATAAATAT AAAGACAACA 54 60 

AAGGATTAAA CTTTGTGTTA ACGACTGGGA CATTTTTTGT AAAAATGAAT GAAAAACAAT 5520 

ATCCTGATTT TAAAAACAAA AATTTAAGAT TGsTATCGCA CAAGCAATAG ATAAAAAAGG 5580 

ATACGTTGAT TCAGTGAAAA ACAATGGCTC AATTCCTTCC GATACACTAA CAGCCAAAGG 5640 

15 AATTGCGAAA GCGCCTAATG GCAAAGATTA TGCGAGTACC ATGAATTCGC CTTTAAAATA S700 

TAATCCTAAA GAAGCAAGAG CACACTGOOA CAAAGCTAAA AAAGAGTTAG GTAAAAATGA 5760 

AGTGACATTT TCAATGAAGA CAGAAGATAC ACCAGATGCA AAAATATCTG CTGAATATAT 5820 

CAAATCGCAA GTTGAGAAAA ATTTACCAGG AGTTACTTTG AAAATTAAGC AATTACCGTT 5880 

TAAACAAAGA GTATCACTAG AACTGAGTAA CAATTTTGAA GCATCACTTA GTGGTTGGTC 5940 

TGCAGATTAC CCTGATC CTA TGGCTTATTT AGAAACAATG AC CACAGGTA GCGCACAAAA 6000 

TAATACAGAC TGGGGTAATA AAGAATATGA TCAATTACTT AAAGTAGCAA GAACCAAATT 6060 

GGCACTTCAA COGAACGAAC GATATOAAAA CTTGAAAAAA GCAGAAGAAA TGTTCCTAGG 6120 

30 AGATGCACCG GTAGCACCAA TTTATCAAAA AGGTGTtGCA CATTTaACAA aTCCTCAAGT 6180 

AAAAGGATTA ATTtACCATA AATTTGGTCC AAATAACTCA CTTAAACATG TATATATTGA 6240 

TAAATGGATA GATAAAGAAA CAGGTAAGAA GAAAAAATAA TATGCTTTGT AAATTAGGCT 63 00 

35 GGAGACATAT CTCCAGT CTT TTTGTGTTGG ATAAAAaCTT TGGGAATAAA AATTTAAAAT 63 60 

AAGTCGTTTT TTAAATTACT GAAATTGATT AAATGCATAA ATAACTGAAT ATTCTAAAAA 6420 

TAAXCTTGTA ATAATTTTTT CTATGAGTAA ACTAAAAAGA AAAAATTAGA TTGAAAGTAG 64 80 

GAGGCATATG TATGGGGAAG CTAATTAAAT ATATTTCAAT ACTTCTTATT GTCGTTTTAG 6540 

TGTTGAGTGC TTGCGGAAAA AG CAGTAATA AAGATGAAGG AGTAAAAGAT GCTACTAAAA 6600 

CGGAAACCTC AAAACATAAA GGTGGTACCT TAAATGTAGC ATTAACAGCA CCGCCAAGTG 6660 

GTGTTTATTC TTCGTTATTA AATAGTACAC ATGCAGATTC TGTAGTTGAG GGATATTTTA 6720 

ACGAAAGCTT 6730 
60 (2) INFORMATION FOR SEQ ID NO: 52: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 6482 base pairs 

(B) TYPE: nucleic acid 
55 (C) STRAND EDNESS : double 
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GGAGCGCCAC CTGATTTATT ACACCCACCT 
ATGCATTAGA TATTGATTTT AAAGTAGAAC 

5 

TTGTGAAATC TTGGTTATTA GACGCACGTG 
AACAACGTAT GAAACCGATG CCTAATAATT 

w CGTTCAATGA AAAATGATGA AGTGCTATTA 

GCAGGAAAGA AAAACGAAGT GgaGCGATTG 
AAACATTAGG TTTAGTAGGA GAATCGGGGT 

15 TTAAACTTAA TGATATTACA AGTGGAGAAA 

TTCGTAAACG TAAAGATTTG CTTAAATTTA 
CATATGCGTC TTTAAATCCT AGGTTAAAAG 

20 

TCCATCATTT AGCAACTGaT AAGCGTGACC 
CTGTTGGATT AAGTAAAGAA CATGCCAATC 
GCCAACGTAT TGGaATTGCC CGTGcATTAG 

25 

AACCAATATC GGCATTGGAT GTTTCAATCC 
TACAACGTGA AAGAGGGATT ACGTTCCTAT 

30 ATATTTCAGA TCGTATTGCA GTCATGCATT 

AAGAAATTTA TCAAAATCCA TTACACGATT 
AACCTGATCC TGAATCAGAA CGCAGTCGCA 

55 ATAATCATTT AAGACAATTA CATGAAATTA 

AAGAAGCGGC ACAACTACGA GAAAATAAAT 
atgCaatgac GAGAAAATTT AGAACACTTA 

40 

GTGGTTGTGC TAATGACGAT GGTATTTATT 
TGTCATCAGA CTTAACATCC CTTGATACAT 
TGAcTGCGCA AACATTCGAA GGTTTATACA 

45 

GTGTTGCGAA AGCTTTTCCT GAAAAGAGTA 
GAAGCGATGC TAAATGGAGC AATGGTGACA 
60 GGAGAAAAAC AGTTGACCCT AAAACAGGTT 

AAAATGCGAG TGATATTAGT ACTGGTAAGA 
TAAATGATGA AACATTACAA ATTGAATTAG 

55 



AAAGGTGATG CATTTGCGAG ACGTAGcAAT 34 60 

CACCGTGGTT TAAAGTTTCA CCGACACATT 3540 

CACCAAAAGT TGAACTACCC GAGCTGGTAA 3600 

ATGAAAAACC ACTCAAGGTA GAAAGGGTGT 3660 

TCTATTAAAA ATTTAAAGCA ATATTTTAAC 3720 

AAAATATTTC GTTTGATATA TACAAAGGGG 3780 

GTGGTAAATC TACAACTGGT AAATCAATTA 3840 

TTTTGTATGA GGGTATTGAT ATACAAAAGA 3900 

ATAAAAAGAT ACAGATGATT TTTCAAGACC 3960 

TAATGGATAT AGTAGCTGAA GGTATTGATA 4020 

GAAAAAAACG TGTCTATGaT TTACTTGaAA 4080 

GCTATCCTCA TGAATTTTCA GGTGGaCAAC 4140 

CCGTTGaACC AGAATTCATT ATCGCGGACG 4200 

AAGCTCAAGT AGTTAATTTA TTATTAAAAT 4260 

TTATAGCTCA TGATCTATCA ATGGTGAAGT 4320 

TTGGGAAAAT AGTTGAAATT GGACCGGCAG 4380 

ATACTAAGTC TTTATTATCA GCCATTCCAC 4440 

AACGATTTAG TTATATTGAT GATGAAGCAA 4500 

GACCGAATCA CTTTGTCTTT AGTACTGAAG 4S60 

TGGTGACACA AAATTAAGGG GAAGGGGGAA 4620 

TTTTAATTTT GATTGCTACA ATTGCATTAA 4680 

CAGATAAAGG TCAAGTATTC AGAAAAATTT 4740 

CATTAATAAC GGATGAAATA TCTTCTGAAG 4800 

CATTAGGAAA AGGTGACAAA CCGGTGTTAG 4860 

AAGATGGTAA AACTTTAAAG GTTAAATTAA 4920 

AAGTGACTGC ACAAGACTTT GTTTATGCTT 4980 

CTGAATTTGC ATACATTATG GGGGACATTA 5040 

AACCTGTAGA GCAATTAGGT ATCAAAGCAT 5100 

AAAAGCCGGT T C CAT AT ATT AATCAATTAT 5160 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 52: 

s AATTTTTGTC ATTATTAAAA ACCTCGCTTT TAAAAGATTG AAAAGTAAAT GAGTGAAATT 60 

AAAGATTATG CACATTAAAA TCACGCCACA ATTTAATTGT GAAAAATATC ACAAATATAT 120 

TATAACACTA AATTTCCCAA AATTCAAAAG TGTGTTTTAT TGCAGAAAAC TTATAACAyG 180 

10 TGCACAAGTT ATAGTGAATT GCAAACGOAT TACTTTAGTC TTTTTAAAAC ATGAAGTATA 240 

ATTTGTATAG CAATAAATAT AAAAATGGGA GGCTATGTTC AATGAGCAAT ATGAATCAAA 300 

CAATTATGGA TGCATTTCAT TTCAGACATG CGACTAAGCA ATTCGATCCA CAAAAGAAAG 3 60 

TTTCGAAAGA AGATTTTGAA ACAATATTAG AGTCAGGTAG ATTGTCTC CA AGTTCTCTTG 420 

GGTTAGAACC TTGGAAGTTT GTCGTGATTC AAGATCAAGC GTTACGTGAT GAATTAAAAG 4 80 

CGCACAGTTG GGGCGCAGCA AAACAATTAG ATACAGCGAG CCATTTTGTG CTAATTTTTG 540 

CGCGTAAAAA TGTAACGTCA AGATCACCGT ATGTACAACA TATGTTAAGA GATATTAAAA 600 

AATATGAGGC ACAAACGATT CCAGCTGTTG AACAAAAATT CGATGCATTC CAAGCAGATT 660 

TCCATATTTC TGATAATGAT CAAGCCTTGT ATGACTGGTC AAGTAAACAA ACGTATATTG 720 

CATTAGGCAA TATGATGACG ACAGCCGCAT TGTTAGGTAT TGATTCATGT CCGATGGAAG 780 

GTTTTAGTCT GGATACAGTG ACAGACATTT TAG CAAATAA AGGGATCTTA GATACTGAGC 840 

AATTTGGTTT ATCAGTGATG GTCGCATTTG GCTACAGACA ACAAGAGCCA CCGAAAAATA 900 

AAACACGCCA AGCTTATGAA GATGTTATTG AATGGGTTGG ACCAAAAGAA TAAATAGAAT 960 

ACCGTATGTC TAAATATATA AAATTAAAAA GTTAGCAATA AAAAAGCCTG CGATTACATA 1020 

AATGAATCGC AGGcTTTTGC GTGAAAAAAT TGTATTAATA AAGTATGGAT GATTATTTTT 1080 

CTGGSACAAG GTCAGTATTT GAATGAACTG TGATGTCAAA CCCTTCTGGT GCCGTAAATG 114 0 

TATGTGTTGA GGCGTCGGGT TGATAAATAT CAACATGTGT TAATCCATAA CTTTGTGAAT 1200 

TGTTTTGTCT TGCTTGATTG GATTGCCAAG TATTAGCAGC AATATGATGG TGATAATGAT 1260 

TCGTTGACAT AAATAGCGCA CGTGGAAAAT CAGACACATG TTGGAATCCT AATTGTTCAA 1320 

4S TGTAACATTG ATATGCTGCG TCTAAATCAT GTGTTTTTAA ATGTAAGTGT CCAATCATGC 1380 

CTTTTGCTGG CATTCCTTGC CAACCTTCAT CAGTACGATG TGTTAATAAG GTTTGGCTAT 144 0 

CAACTTCTAA AGTATCCATT TTAACTTTGC CATTTTGCCA TTCCCATGAA GATGAAGGTC 1500 

50 TATCGCGATA GACTTCAATA CCATTACCTT CGGGGTCGTT GAAATATAAA GCTTCACTTA 1560 

CTAAATGATC ACCAGCGCCG ATGCCCATAT TTTTTTGTGC CACGAAATAT AAGAAGTTAG 1620 
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aAGTCTGACG GcCGTCTTCT AATAAATGTA ACGTTAGAGT ATGGcCACCA GTCCCAACAG 1740 

ATAATACGGT TGTATTATCG TCAGAACTTT TAACGGATAG TCCTAAAATG TTTTTGTAAA Id 00 

ATGTTGTCAT TAAGTCTAAG TCTCTTACGT TCAGTACAAT GTTTGTCACT TGTGTTGCTG 1860 

TTTTATCGTG AAATGCCATT ATGCATCGCC TCTTTTTCTA TTTTTCTATA AGTTAGTATA 1920 

AAAAGTATAC CAGAAAAGAA AATGAATTGA TAG CAT AAAG TTTGAAATGC AAAATAACTA 1980 

GTCGTTTTGC AATTTTAtAT TGATGCGAAC AAAAAAGCGA TGGTACAGTT GCACCATCGC 2040 

AAAATTTATT TAACCAAGAT ATACATCTTG ATATGAATCT TCTTTTTCTA ACATATGTTT 2100 

GGCAAATGAA CATGAGGCAA TAATTTTCAA ATTATTTTCT CGAGCGTGTT CAACAACTGc 2160 

TTTAAGTAGT TTTTTGCCAA CACCTTGACC ACCAAGTTCA TCAGATACGC CTGTATGATC 2220 

AATGTTAATT TCATTATTAT CCACAAAACG GTATGTGATT TCAGCTAAAG CATTATTTTC 2280 

20 ATCATCACCA ATATAGAATT TGTTCTCGCC TTGTTTGATT TCAAGGTTAC TCATACATAT 2340 

CAACTCCTAT CATGATTGAT TATAGTATTT CCCTATTCTA TTTTAACTTA AACGAAGTCA 2400 

AAGGTGCATG ACAGTCATGT GACGACATTG CCACATCTAT GTAGTCGTTT TTATTAAGCA 2460 

CAGTTTGAAA TGAAGATGAA AACACGTATC TTGACATTAA ATCTATTCAG CTATATAATT 2520 

TATCTCGAAA TCGAAATAAA ATAAAAAAGT TGGTGATCAT ATGGATCGAA CGAAACAATC 2580 

TCTCAATGTT TTTGTCGGAA TGAATAGGGC GTTAGACACA TTAGAGCAAA TTACAAAAGA 2640 

AGACGTAAAG CGATATGGCT TAAATATTAC TGAATTTGCA GTGCTCGAGT TGCTTTATAA 2700 

TAAAGGTCCG CAACCAATTC AACGTATTAG AGACCGCGTA TTAATTGCAA GTAGCAGCAT 2760 

TTCATATGTT GTAAGTCAAT TAGAGGACAA AGGTTGGATT ACACGTGAAA AGGATAAAGA 2 820 

TGATAAACGT GTATATATGG CTTGTTTAAC TGAAAAAGGT CAAAGTCAAA TGGCAGATAT 2880 

TTTCCCTAAG CATGCTGAGA CATTAACAAA AGCGTTTGAT GTGTTAACAA AGGATGAATT 2 940 

40 AACAATCTTA CAACAAGCGT TTAAGAAACT AAGTGCACAA TCTACAGAAG TGTAAGGCGT 3 000 

GCACTAAAAA TTTACATTAA AGTATCTCGA TTTCGAGATA AATGCACTAA AAATATAAAG 3060 

AGGGTATATA AAATGATAAA TAATCATGAA TTACTAGGTA TTCACCATGT TACTGCAATG 3120 

ACAGATGATG CAGAACGTAA TTATAAATTT TTTACAGAAG TACTAGGCAT GCGTTTAGTT 3180 

AAAAAGACAG TCAATCAAGA TGATATTTAT ACGTATCATA CTTTTTTTGC AGATGATGTA 3240 

GGTTCGGCAG GTACAGACAT GACGTTCTTT GATTTTCCAA ATATTACAAA AGGGCAGGCA 3300 

GGAACAAATT CCATTACAAG ACCGTCTTTT AGAGTGCCTA ACGATGACGC ATTAACATAT 3360 

TATGAACAGC GCTTTGATGA GTTTGGTGTT AAACACGAAG GTATTCAAGA ATTATTTGGT 3420 
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TTAAATGAAG GGGTAGCACC TGGTGTACCT TGGAAOAATG GACCGGTTCC AGTAGATAAA 3540 

GCGATTTATG GATTAGGCCC CATTGAAATT AAAGTAAGTT ATTTTGACGA CTTTAAAAAT 3600 

ATTTTAGAGA CTGTTTACGG TATGACAACT ATTGCGCATG AAGATAATGT CGCATTACTT 3660 

GAAGTTGGCG AAGGAGGCAA TGGTGGCCAG GTAATCTTAA TAAAAGATGA TAAAGGGCCa 3720 

GCaGCACGTC AAGGTTATGG tGAGGTACAT CATGTGTCAT TTCGTGTGAA AGATCATOAT 3780 

GCAATAGAAG CGTGGGCAAC GAAATATAAA GAGGTAGGTA TTAATAACTC AGGCATCGTT 3840 

AATCGTTTCT ATTTTGAAGC ATTATATGCA CGTGTGGGGC ATATTTTAAT AGAAATTTCA 3900 

ACAGATGGAC CAGGATTTAT GGAAGATGAA CCTTATGAAA CATTAGGCGA AGGGTTATCC 3960 

TTAC CACCAT TTTTAGAAAA TAAAAGAGAA TATATTGAAT CGGAAGTTAG ACCTTTTAAT 4020 

ACGAAGCGTC AACATGGTTA ATTGGAATGA GGAGGATTTG TGATGGAACA TATTTTTAGA 4080 

20 GAAGGACAAA ATGGTGCGCC AACACTAATA TTATTGCATG GTACAGGTGG TGATGAGTTC 4140 

GATTTATTAC CGTTAGGCGA AgcATTGAAT GAAAATTATC ACTTGTTAAG TATTAGAGGA 4200 

CAAGTTTCAG AAAATGGGAT GAACCGTTAT TTCAAACGTC TTGGTGAAGG TGTTTATGAT 4260 

GAAGAAGATT TGGCATTTCG TGGACAAGAA TTGTTGACGT TCATTAAAGA AGCTGCTGaA 4320 

CGTTATGATT TTGaTATTGA AAAAGCAGTA CTTGTTGGAT TTTCAAATGG ATCAAATATA 43 80 

GCGATTAACT TAATGTTGCG TTCAGAAGCA CCATTTAAAA AAGCATTGTT ATATGCACCG 4440 

TTATACCCAG TTGAAGTAAC GTCAACAAAG GATTTATCAG ATGTCAGTGT GTTGCTTTCT 4500 

ATGGGGAAAC ATGATCCAAT TGTGCCATTA GCTGCAAGTG AACAAGTCAT TAACTTGTTT 4560 

AATACACGTG GGGCACAAGT CGAAGAAGTT TGGGTGAAGG GCCATGAAAT TACAGAAACT 4620 

GGATTAACGG CTGGTCAACA AATACTTGGG AAATAACAGT TCTATTAAGA AGCGGACAGA 4680 

TGGAAAAGAT TTTTACTTTT CATCTGCCCG CTTTTTTGAT TTTGAAGTGC TGTACTAAAT 4740 

40 TTTACAATAG TATAGATATT TTAATCGATA TGAGATTTGC CGGTAATACG CTTAATTAAA 4 800 

CCTTTATAGA GTACAGGTAT GAGTAAGATG AAACCGAACA ATCCCATAAT AGGGAATACT 4 860 

TTTCCAATTA ATGAAATGAa ACCGATAAAT GTACTAATAT AAGTGATGAC AGCCATTGTA 4 920 

ATAATAATGA TGAAGTAACG TCTGCTGAAT GGAACGCTGA AACGTGACG C AAATG CAT AC 4980 

ATTAATCCAA CAACAGTATT GTAGATGACA AGTATCATAA TGACAGACAT AATAATACCA 5040 

ATTGACGGAG ACATTTGTGT CGCTAATTTT AATGTAGGTA GATCTACGTG TTTAATTTTA 5100 

TCGAATTGAG AAATTAAACC TAGATTAATC ATCATGAGTA AAAATGTAAT GATTAAACCG 5160 

CCAATCAAGC CCCCGTATAA CGTTGAGTCA CGATATTTAA CTTTACTACC CAT CACTG AT 5220 
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CCAGGTGATA 


ATGATTTCTG 


CTTATGAATC 


TGAGCATCAT 


TATTAGCGGC 


AGTAAAATCA 


5340 




AGATGACTTG 


TTGTGAAATA GTAGACCGCA ATCATAATGA CAATCGCAAT 


TAAAAATGGG 


5400 


5 


GTAACACCGC 


CAAGCACAGC 


AATTAAACGA 


TCGAATTTTA 


GAAACAGTGT 


TGCTAAAATA 


5460 




AAGGCGACTA 


ATATGAGTGC 


GCTCAGCCAA 


TACGGTAAGT 


TGAAACTTTG 


ATGAATGGTT 


5520 


10 


GACGCACCAC 


CTGCAGTCAT 


AATAATAGCT 


AAAGACAACA 


TAAACATTGT 


TAAAATAATA 


5580 


TCAAAACCTC 


TTGCAATAGA 


GGGGTATAAG 


AAATAGTTAA 


TTGAATCAGA 


ATGATTTCTG 


5640 




GACTTTAGAT 


GATGACCTGT 


ATGCATGACA 


ACCATTCCAC 


CTAAAGTAAT 


CAATAGTCCT 


5700 


15 


GTTACAATAA 


TGCCTGAAAT 


GCTATATGCG 


CCATGACTTG 


TGAAAAACTG 


GAAAATTTCT 


5760 




TGACCAGTAG 


CAAAGCCGGC ACCAACGACA ACACCAACAA AGGCAAATGC 


CACAATAATG 


5820 




GACTCTTTTA 


AGATACGCAT 


GATTTAAAAA 


TGTCCCTTCG 


TAATTTTAAG 


TAATATAGAA 


5880 


20 


AATGTAACAT 


ACATGTTAAT 


GAAAAATATA 


GTACTAATAT 


AGTATTTTGT 


TAAATTGGAG 


5940 




TAGAAGCGAG 


GGTGTOGGTC ATTTCATTAA TTTATTAGTT GATTTTGCAT 


TrrrriGCTG 


6000 




TAAAGTTGTT 


ATAATACAGT 


TAACAGGAAT 


TAGCATAGAT 


ACACCAATCC 


CCTCACTACT 


6060 


25 


CGCAATAGTG 


AGGGGATTTT 


TTTCGGTGTA 


GCTAGGTCGC 


CTATTTATCA 


TCGTGTTTGC 


6120 




GTAgCaATGC 


GTAAACACAG 


T AC CACT AAA 


TAAGTGCACG 


ATACATGCAT 


CAAATGTCGT 


6180 


30 


CTTTAGTcTA 


AGTAACGATC 


ATGCATTAAC 


ATTTTCAAAA 


TATCTATTTG 


AGCTTGAAGA 


6240 


TCTTTACCAA 


TATTGGTATC 


ACGAATCTTC 


TTACGTTGTA 


ATTCTTTATC 


TACGACGCGC 


6300 




IT' 1' AT AG AAA 


GTTCATCGAT 


ACCTTCGGAA 


AGTATTTTTn 


CTTTAGCGTT 


AAATTGTTGG 


6360 


35 


TGTGCAACGA 


GTTGCATACC 


GAATGAATTA 


TACAATAGTG 


TATAGCCTGC 


AATGCCAGTn 


6420 




GTTGACTGAT 


AAGCTTTTGA 


AAAGCCACCA 


TCAATGACAA 


GCATCTTTCC 


ATCAGCCTTG 


6480 




AT - 












6482 


40 


(2) INFORMATION FOR SEQ ID NO: 53: 









(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 16592 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 53: 

SO 

ATTTAAGGCG ATTGCTTGTG TATTTCTCTC TTTTGTAGGC AAACCTGCAC TCGTTCCAAA 60 
AAATGTAACT TCCATATATG CCCCTCCTTT TCTTCAATTC ATTTTATCAT AAAATTTGTA 120 
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AATTTTTCTA ACTTTAACGT AGACATAACT ATATAAATTT TGATAATTAC GTTATACTTA 240 

TCATTAATAA GTATCACATT AAACATGATA CATGAATCGA TATTTCATTT AAGACACTGC 300 

ATACAGTCGA GCATATTGTA TGACCTACTG AATGGATTAT CTTATAATAA TAAATCATAT 360 

ATCTAATTAA GAATTGAGGT TTTAATCTTG AGTACTAAAA ACAAACACAT CCCATGTTTA 420 

ATCACAATCT TTGGTGCACT GCGTGACTTA AGCCATCGTA AGTnGTTTCC ATCAATATTC 480 

CATCTCTACC AACAAGACAA TTTAGATGAA CATATTGCCA TcATCgGTAT TGGACGTCGT 540 

GACATkwnTA ATGATGATTT CCGTAATCAA GTAAAATCAT CAATTCAAAA GCACGTAAAA 600 

GATACAAACA AAATTGACGC GTTTATGGAA CATGTCTTCT AT CATAGACA TGATGTT AG T 660 

AATGAAGAAA GCTATCAAGA ATTACTAGAT TTTAGTAATG AATTAGATAG CCAATTTGAA 720 

TTAAAAGGTA ATCGACTATT CTATTTAGCA ATGGCACCAC AATTCTTTGG CGTTATTTCT 780 

20 GATTATCTAA AATCTTCTGG TCTTACTGAT ACAAAAGGAT TTAAACGCCT TGTTATCGAA 840 

AAACCATTCG GTAGTGATTT AAAATCAGCC GAAGCATTAA ACAATCAAAT TCGTAAATCA 900 

TTTAAAGAAG AAGAAATTTA TCGTATTGAC CACTATTTAG GAAAAGACAT GGTTCAAAAT 960 

ATCGAGGTAT TACGTTTTGC GAATGCGATG TTTGAACCAT TATGGAATAA CAAATATATT 1020 

TCAAACATCC AAGTTACATC TTCTGAAATA CTAGGTGTTG AAGATCGTGG TGGTTATTAT 1080 

GAATCAAGTG GCGCGCTAAA AGATATGGTG CAAAACCACA TGTTACAAAT GGTTGcATTA 1140 

TTAGCTATGG AAGCACCTAT TAGTTTAAAT AGTGAAGATA TC CGTGCTG A GAAAGTAAAA 1200 

GTACTTAAAT CACTGCGTCA TTTCCAATCT GAAGATGTTA AAAAGAACTT TGTTCGTGGT 1260 

CAATATGGCG AAGGCTATAT CGATGGTAAA CAAGTTAAAG CATACCGTGA TGAAGATCGC 1320 

GTTGCAGATG ACTCTAACAC ACCTACCTTT GTTTCAGGTA AATTAACAAT TGATAACTTT 13 80 

AGATGGGCTG GTGTACCATT CTATATTCGT ACTGGTAAAC GTATGAAATC TAAAACAATT 1440 

CAAGTTGTCG TTGAATTTAA AGAAGTACCA ATGAACTTAT ACTATGgAAA CTGaTAAACT 1500 

GTTAGATTCA AACCTATTAG TAATCAATAT CCAACCTAAT GAAGGTGgTA TCTTTtACAT 1560 

CtAAATGcTA AGaAAAATAC ACAAGGTATC gAAACAGrAC CTGtCCmATT GtCTTACTCm 1620 

ATGaGCGcTC aAGaTAAAAT GaATACTGTA GATGCATATG AAAATCTATT ATTTGATTGT 1680 

CTTAAAGGTG ATGCCACTAA CTTCACGCAC TGGGAAGAAT TAAaATCAAC ATGGAAATTT 1740 

GTTGATGCAA TTCAAGATGA ATGGAATATG GTTGaTCCAG AATTCCCTAA CTATGAATCA 1800 

GGTACTAATG GTCCATTAGA AAGTGATTTA CTACTTGCTC GTGATGGTAA CCATTGGTGG 1860 

GGACGATATT CAATAATTGA ATTAAAACGC ACATGTTAAA CAAAAATAAA TGAGCGAATG 1920 
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TATATTATGA AATTATATTT TACAATGCCC AAAACTATTT TAATAATCAT TGAACAAATG 2040 

GGTGTATAAT TTATAGAAAT AATGTAGAAT AAAAATAAAT GATTGAATTA ATTGGAGTGA 2100 

AAGTTTTGGA CGTTATCAAG CAAATACAAC AGGCAATTGT TTATATTGAA GATCGTTTAT 2160 

TAGAGCCTTT CAATTTGCAA GAATTAAGTG ATTACGTTGG TCTTTCGCCA TACCATCTTG 2220 

ATCAATCATT TAAAATGATT GTCGGCTTAT CTCCAGAAGC TTATGCACGC GCGCGTAAAA 2280 

TGACACTCGC TGCAAATGAT GTGATTAATG GTGCTACACG ACTTGTAGAT ATCGCTAAAA 234 0 

AATATCACTA TGCAAATTCA AATGATTTTG CAAATGATTT TAGTGATTTT CACGGCGTAT 24 00 

CACCTATTCA AGCCTCTACT AAAAAAGATG AATTACAAAT TCAAGAGCGA TTATATATCA 2460 

AATTATCAAC TACTGAGAGA GCACCTTATC CATACAGATT AGAAGAGACA GATGATATTT 2520 

CATTGGTTGG ATATGCACGA TTTATAGACA CTAAGTATTT GTCACATCCT TTTAATGTTC 2580 

20 CGGATTTTTT AGAAGACTTG CTCATTGATG GTAAAATTAA AGAGTTACGA CGATATAATG 264 0 

ACGTTAGTCC ATTTGAACTA TTTGTTATTA GTTGTCCTCT TGAAAATGGT TTAGAAATAT 2700 

TTGTAGGTGT ACCAAGTGAA CGTTATCCTG CACACTTAGA AAGTCGATTT TTACCTGGCA 2760 

AACATTGTGC GAAATTCAAT TTACAAGGTG AAATTGATTA TGCAACTAAT GAAGCTTGGT 2820 

ACTATATTGA ATCAAGTTTG CAGTTAACAT TGCCATATGA ACGAAATGAT TTATATGTTG 2880 

AAGTGTACCC TCTCGATATT TCATTTAATG ACCCATTCAC TAAAATTCAG CTTTGGATTC 2940 

CTGTTAAACA GAGTCCTTAT GACGAAGATT AAATAATAAA AAACAAAGAA GCCCCCTAAT 3000 

AT AT CT AT AG GTCTACAAAT GGCCTTAGAT TCTATTAGGG GGCATATTAA TATGTTAATT 3060 

TAGTTCGATA ACACATGCTT CATATGGACG TAACTGTTTT AAATTAACTT TGGCATCATA 3120 

ATTAAATAGC TTTACTTCTC CATGGCTTAA ATCAAATGGT ACAGTTAATT CTGCTTCGTG 3180 

GTTAGTAAGA TTACCTACAA TAAGAACTTG CTTTTCATTT AATGTTCTCG TGTACGCAAA 3240 

40 AACTTGTGAA TTTTCAGCAT CTACTAAATC AAATTGACCA TATACGTATA CATCATTAGA 3300 

CTTTCTTAAT TGAATTAAAT CTTTATAAAA TTGTAATACT GAATGCTCAT CTTCTAATTG 3360 

TTGTGCAACA TTGATAGTTT TATAATTCGG ATTCACTGGG AACCACGGTT CACCATTTGT 34 20 

AAATCCTCCA TTTAACGTAT CAT CCCATTG CATTGGTGTG CGAGAATTAT CTCGGTTCTC 34 80 

ATCTTTATAT TTCGCAAGTA AAGCGTCTAC ATCTCCACCT TGAGCTTTCA CTATTTGATA 3540 

GTCATTTTTA ACAGCAACAT CGTTAAACGT TTCAATACTT TCAAATGGAT AATTCGTCAT 3600 

ACCAATTTCT TGACCTTGAT AAATGAATGG CGTACCTTGT TGCAAGAAAT AAACAGCTGC 3660 

ATGACTTGTT GCTGATTCAT ACCAATACTT GTCATCGTCA CCCCACGTCG ATACACGTCG 3720 
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CCATCTATTT AATACAGATT TATACGAATT TACATCAAAG TGAGAATCAC CACTATTCCA 3840 

CAGTCCCAAA TGTTCAAATT GGAATATCAT ATTAAATTTA CCATTTTCTT CCCCGACCCA 3 900 

GTCATCAGCA TCATCAGGGC TTACACCATT CGCTTCACCA ACAGTCATAA TGTCATACTT 3 960 

ACTTAATGAG CGATCTTTCA TCTCTTGTAA CCAAGTTTGT ATACCTGGCT OATTCATATC 4020 

TACATCAAAT GCTGGGGCAT ATGTTTTACC CTCAGGTACA GGTAAGTCAC CCGCTTCAAA 40 80 

CGTCTTCTTA ATATGCGTAA TTGCATCTAC TCTAAATCCA TCAATGCCTT TATCAAACCA 414 0 

CCAGTTCATC ATTTCAAATA CAGCATCTCT AACTTCCGGA TTACCCCAAT TCAAATCAGG 4200 

TTGTTTTTTA CTGAATAAAT GGAAATAATA TTGCTCAGTA TT AG CATCAT ATTCCCATGT 42 SO 

AGATCCATTA AATATACTTT CCCAGTTGTT AGGTTCAGAG CCATCTGGCT TTGGATCTTG 4320 

CCAAATGTAC CAATCACGTT TGGGATTGTC TTTACTAGAT TTGGATTCTA TAAACCAAGG 4380 

2 0 ATGTTCATCA GATGTATGAT TTACAACTAA ATCTAAAATA AGCTTCATGC CTCTATCATG 444 0 

AACACCTTTT AATAAACGAT CAAAGTCTTC CATCGTTCCA AATTCATCCA TAATCTCTTG 4 500 

GTAGTGACTA ATATCATAAC CATTGTCATC ATTAGGTGAT TTAAACATTG GACTGAGCCA 4560 

25 AATGACATCG ATACCGAAAT CTTTTAAGTA GTCCAATTTA TCAATCATTC CAGGTAAATC 46 2 0 

CCCAATACCA TCGTGATTAC TATCATTAAA ACTTCTTGGA TATACTTOAT ATGCTACTGC 4680 

TTCTTTCCAC CATTGCTTAT TCATTTTAAA ACTCCTTTGC TATCGCTGTG TTGATTTTCT 474 0 

30 

TATTTTTAAT TCTGTATCTA TAATGACGAG TTCAATAACA TCCTGTGCTT TGTTTTTCAA 4 8 00 

TATATTTAAA ATTGCTG CAC CAGCCTGTTG ACCTAACATT CGAGGCTTGA TGTCAATACA 4 860 

GGTTTGTGGT GGTGACGCAA TTTCGGTTAA ATAAGAATCA TTGAACGTTG CTGTCATTAC 492 0 

ATCTTTCGGA ATTTCAATAT TAAGTT CAT A TAGGACACTT AAAATCGCTA AATGTAACAT 4 980 

AGCATCTAAC GAAATGATTG CCTGTTTAAT ATTTGGGTCC TTCAAACGCG TATGTAGATT 5040 

TTGCATGTAA TTAAAAATAA CTTCTCTTTC ATTACTAGTC TCAATAATTT GATAATTAAT 5100 

TTTATTTTGA GAAGCTATCG TTTCAAATCC TTGAATTCTA TCTTTTGAAA CTTCAAAATT 5160 

TCCTTTTTCT GTAATAAATA TTAATTCATC TACACCTTGT TCAATAACAT GTCGTGTCAA 5220 

45 ATTTTCAGAA GCTAATATAT TATCATTATC TATATGTGTA AATTGATGAT CTATATCCGA 5280 

TGTAGGCTTA CCAATCACAA TAAATGGCAT GCTTTCATCA ATTAACATTT GTTTAATCGG 5340 

ATCATTTTCT TTTGAATAGA GCAGTATAAA CGCATCAACC ATTCGTTGTT TAATCATTTT 5400 

ATAAACTTCA TCCATTAAAT CATTCATATT ATTTGAGACT GTCGTTTGTG TACCATAGCC 5460 

ATGCTGGTTA CACGTTTCAG AAATTCCTAG CAATACATTG ATGTAGAATG GATTCAGTCG 5520 
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AGTTCTAGCA 


GCGGTATTAG 


GAAAATAATT 


CAATTCTTCC 


ATAACTTTCT 


TCACTTTTGA 


S640 




AATTGTCGCT 


TCGCTAATAC 


GTTGATTTCC 


TTTTATAACT 


CTTGAAACTG 


TCGAAGGAGA 


5700 


5 


AACACCGGCT 


TTTAGTGCAA 


CATCTTTAAT 


CGTAACCATT 


TAATCACCTC 


CTGTTAATTT 


5760 




CTGCATCGGA 


AAACGCTTCC 


AACCACTGTA 


TAATACCAGT 


TTAGTCACAC 


TTTCTAAAAA 


5820 


10 


AGTCAAAAGA 


TTTGTGCAAA 


CGATTGCATA 


AAACGATAAA AATAAAACCT 


TCATACTGAA 


5880 


ATTCAATCCG 


AAAATCAATA 


TAAAGGTTTG 


TATAAATATT 


AAAATCGATT 


GTTTAGTCAC 


5940 




TAACTGCAAA 


ATAGTTACCT 


TGGCCATCTT 


GAAAATTAAA 


TACACGTTGA 


CCATTCATTT 


6000 


15 


CTACTATATC 


ATGCCCAGTT 


AAACCTAAAT 


CATTTAATTT 


TGAGTATAAT 


GCATCAAAGT 


6060 




TTTTCTCTTT 


AAACATTAAA 


GATGGTGTTC 


CTAGGTTCAC TTCCGGGCTA TGCTTTTCAA 


6120 




TAAATTCTTT 


TGCCATAATC 


GTCAATGACG 


TTTCAGCATC 


TTTGGTAGGT 


GATACTTCAA 


6180 


20 


CTGCAACATA 


GTCCTCAGCT 


AACGGTGTTT 


CACTTACAAC AACAAATTCT AAAGTTTCTG 


6240 




TCCAAAATOC 


TTTCGCTTTT 


TCGACATCAT 


CAACATATAA 


CATAACTTGA 


TTTAACTTTT 


6300 




CCATAAAATA 


GTACCTCTAT 


TTGTCTATAG 


TACATGCTAT 


CATAACACAG 


TAAATATTTT 


6360 


25 


ATTACTTCAC 


AAAATGCTTA 


AAAATATGGC 


GGGATGCTTT 


TAAGGTCAAG 


GATAATACTT 


6420 




GTGTAATTTT 


TTATAGGTTG 


TAGCTACTCT 


ATCACACTCT 


CTTTTATATT 


TATCAAAAGA 


6480 


30 


TATAAAAAAG 


GATAGTATCT 


TTCAACTATC 


CTTTAATCAA 


T ATT ATT CTT 


CAATCCATTG 


6540 


TGTATGGAAT 


ACGCCtTCTT 


TAT CTTTTCT 


TTCGTACGTA 


TGAGCACCGA 


AGTAGTCACG 


6600 




TTGTGCTTGA 


ATTAAGTTTG 


CAGGTAAATC 


AGCAGCACGG 


TAACTATCAT 


AGTAATTAAT 


6660 




ACTTGATGAG 


AAACCAGGTG 


TTGGTACACC 


ATTTTGAACA 


C CAGTTGCGA 


CAACATCACG 


6720 


TAACGCATCT 


TGATATTCAG 


TAACGATGTT 


TTTAAAGTAA 


GGATCTAGCA 


ATAAGTTTTG 


6780 




TAATCCTGGA 


TTATTATCGT 


AAGCATCTTT 


GATCTTTTGT 


AAGAATTGTG 


CACGGATAAT 


6840 


40 


GCAACCTTCT 


CTCCAAATCA 


TAGCTAAATC 


ACCAAGTTTT 


AAATTCCATT 


CATTATCTTC 


6900 




ACTTGCTTTA 


CGCATTTGCG 


CGAAACCTTG 


TGCATAAGAA 


CAAATTTTAC 


TCATATATAA 


6960 




TGCTTTACGA 


ATTTTTTCTA 


AAAAGTCTTT 


CTTGTCACCA 


TCAAATGATG 


CTTTTGGACC 


7020 


45 


ATTTAATTCT 


TTAGAAGCAT 


TTACGCGCTC 


TTCTTTGaTT 


GAAGAGATAA AACGTGCAAA 


7080 




TACAGATTCA 


GTAATGATTG 


TTAATGGAAT 


ACCTAATTCT 


AATGCGTTAA 


TTGAAGTCCA 


7140 




TTTTCCTGTA 


CCTTTTTGaC 


CTGCAGTATC 


AAGAATTTTT 


TCAACTAATG 


CTTCTTTATT 


7200 


SO 


TTCATCTAAT 


TTCATGAAAA 


TAT CACCAGT 


GATTTCAATT 


AAATAACTTT 


CTAATTCACC 


7260 




AGCATTCCAG 


TCTTTGAACG 


TTTGAGCAAT 


GTCTTCATGA 


GACATGCCTA 


ATAATTCTTT 


7320 
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CATTTTCACA TAGTGTCCAG CACCATTAGG 
TTTTGCCTTT GCAGCAATTG CATCAAGAAT 
6 TCCACCCGGC ATTAATGACG GACCAGTTAA 

ACCAATAAAG TTGATTGCAC TTTGTGywAA 
GTTTGTATTA CCACCATCAA TTAAAATATC 

10 

AATCGTTGCG TCCGTAGCTT TACCTGCTTG 
TAAAGAATTA ACAAATTCTT CCAATGAATA 
TTCAACCATT AAATCAGTTT TTTCACTTGA 

IS 

TGATTCAATA TTCCAAGCTA GGTTTTTACC 
TTGTGTCATA TTACTTACCT CACTTGTTGA 

20 CATACACTAC ACTAAATCAT TTCGAATGTC 

GACTTGCAAG CAAGTTCAAT GATTTAATCG 
CATAACCCAC TCCTAAAATG ACTGAAGGAA 

25 AACCGCCACC AGAAATAATT GTATTTGCAG 

CAATTTTAAC AACCGCTTCA TTATCATTAA 
TAACTACTGC TTTCCCACCT AATTCTGATG 

30 

TGACTTGTGT TTTTATTCTT TCTGGATCGT 
CATCTGCAAC AATATTCGTA GCTGAACCGC 
TTTCATCAAC TTGTCCTAAT TTCATTCGAC 

35 

TAACACCCTC TTTTGGCGTA CTTGCATGAG 
ACATTTGCGT CGGTGCACCT ACAACCGTAG 
AACCAAAGTC CGCGTCCAAC AACTCTGAAT 

40 

CTTCTCCAAC AGTAAT CACA AATTGAATTT 
CTTGCAAAAC TTCAAGCATC GCTGATAATC 

45 TACCATCAGA GTATATGTAG CCGTCATCTT 

CAACAGTATC CATATGGCTC GTCAAATATA 
TATTCATTGT ACACACTAGA TTATTGGCAC 

60 CTTTAACATC TAACCCTAAT GCTATGAATT 

CATTCC CTGT CTCAGAATCG ATTTGTACAA 

55 



TCCAATATAA GTAACACATG AAGCACCGTC 7440 

ATCTGCAACT TTGTTATAAG CTTCTTCTTG 7S00 

CGCTCCAATT TCACCACCAG AAACGCCCAT 7560 

TGCTTTATTA CGTCTGATAG TATCTTGATA 7620 

TCCATCATCT AATAAAGGTA ACAAACTATC 7680 

AACCATTAAT AAAATTTTAC GTGGTTTTTC 7740 

CGTTGGATGA ATATTTTTCC CTTTTGATTC 7800 

GCGGTTAAAT ACAGATACAC TATATCCGCQ 7860 

CATAACGGCT AAACCAATAA CTCCAATTTG 7920 

TTTTTCATTA GTATTGTATC ACAAAATAGA 7980 

GCGCAACTAT TTTGATTATT TCTAACACTT 804 0 

GCATTCTCTC ATTTGTTGTA TGGATTTTTT 8100 

TACCAAATGT ATTAATAATA CTGCCGTCTG 8160 

ATAATCCTAA ATTACGAGCA CTTTCTTGTG 8220 

TTTTAAATCC TGGATAACTT TGCTCCACTG 8280 

CAGTAGTTTC AAACACATCA GTCATATGTT 8340 

GAGAACGTGC CTCTGCTTCT AAAATGACTT 8400 

CATGAAACTT ACCAATATTG GCAGTAGTTA 8460 

TAATTGCTTT CGCCGCAATA TTAATAGCAC 8520 

CCGTTTTGCC AAAAATTTTA GCTGAAATTA 8580 

TACCGACATC AGCACTTGCA TCAATAGCAT 864 0 

TTAATTCTTT AGCACCAATT AAAC CTGATT 8700 

GTCCATGTGG GATTTGTTGT TCCTTTATCA 8760 

CTGCTTTATC ATCTGCACCT AGAATAGTCG 8820 

TTACAATTGG CTTTACATTA ATTGCGGGTA 8880 

ATTTAGGTAC TTCGCCTTCT TCGATAGTAC 8940 

CTAATTTAGG ATGTTTAGCC GCTTCATCTT 9000 

TTTCTTTTAA AATAGGTTGG ATTGTTGATT 9060 

GTTCAAAAAA CGTATTAAGT AATCTTTGCT 9120 
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GATGAAATAA AATGTTACAG TAATTGACGT TACACAGATT TATCAGGTTT GTAAATTGTG 9240 

TCATATTATT TTCAATTTAT TATATATAAT TATTGTAACT CAAACTAAGC TTTGTCAAAA 9300 

ATATATTGAT TGATTTTTCA AAGATATCGT ATAATOAGGA AAATGACATA AGCAAACTTA 9360 

CTCATGTTTT TTATTATATT CCTTTATGAT GATTGCTAGT TATATCGTCT CAAGTTAAAA 9420 

GTTTTATATC TTATGT CGT A ATTATTAATA CAAAGGTTAT TCATTTGGAG GCACACAAAA 9480 

TGCAAAATAA AGTTTTAAGA ATTATCATTA TCGTTATGCT TGTATCAGTT GTATTAGCAT 9540 

TGTTATTAAC GAGTATCATT CCAATTTTAT AAACTATATC TCAACTACCT ATACAAAATC 9600 

ATACAATTAA AAATCCATCC ATTATAAACG CATGTATTAA TAAGTTATCG TATTGCAACG 9660 

ATTACTTTCA AACATGGGTC ATACGGATGG ATTATTTTTT AAGCTACTTC ACTATGCATT 9720 

TTCAATGAAC CAAATTGCGA TTTGATTTGT AAATATTCTT CTAATTCATT TAATATTTGA 9780 

ATAATACTTG CTCTCGAGTT AAGCGCTTTG TGTGTTGTTG GCAATGGCAG TTCATCCAAT 9840 

TTCAAACGCG TCTCATACAA ATTGTGTAAA CGCATTGCTG TATAGTCATT ACTATTCACA 9900 

TTTAGACCAA TTTCTTTCAG CAGTGACGCA ACATCATTTA AAAGCGGATC TTTATGACAG 9960 

ATACTTTCGA TGAGCGGTTT CATTCTCATT AACAATTCCA CTTGCTCTTC TCGCATATCA 1002 0 

AAATAATGAT AGTATGAATT TTCGTTTCTA ACAAAATGAT TTTTAACATC TCGGAACGCG 10080 

AT AGACT t CG CCTTTTTAAT ATTTAAAAGT AACACTTCAA ATTCAATCGC AATGGTATCT 1014 0 

TCATATTTTT CACAAATATA ACTATATTTA CTAAAAATAT CAGCAATTTG TTGCTCAATT 10200 

TTACATTTGT ATTCGTC t AG TTGTTTGTCT AAACTTGGCA TCATTAAATT CaTTGTAAAT 10260 

GCAATGCTTA GTCCAATTAA CAGTAATAAT GTTTCATTAA CAATTAAATG TGCATCAATT 10320 

GATTTTGCAT TAAAAACATG AAGTAATATA ACGCAACTCG TAATGACACC TTCTTGTACT 10380 

TTTAATACGA CAGTTAATGG TATAAATAAC AATACGATAA TACCGAGTAC AATTGGACTC 10440 

TGACCTAATA AACTAAATAT TGCTGAACCT AAAAACAATA CTAAAAAACA TGATACTAAT 10500 

CTTGAAATAA TCGCTTGTAG CGAATGTACT TTTGTATGTT TAATACATAA TACGACTAAT 1O560 

ATGGCGCTTG AAGCATAATT ATCTAAACCT AACAGCTTAC TAATAATTAC ACCTAAAGTC 10620 

ATACCCACTG CTGTTTTTAT TGTTCTAAAT CCAATCTTGT AAGGATTTAA CTTTAACATG 10680 

GGTTAGCGCC TCTTATCTTT CTTCACAATA TTTATTGAAT AATGTTTGTA ATTGATTAAT 10740 

TACGTTCATC ACATCATGAC CTTCGATTTG ATGTCTTTCA ATCATTTCTG TAATCTTTCC 10800 

ATCTTTTACT AATGCAAATG ACGGACTTGA AGGCGCATAA CCTTCGAAGT ATTCACGCGC 10860 

TCTTTGTGTC GCTTCTTTAT CTTGTCCAGC AAATACTGTC ACTAGACGAT CAGGTAATAC 10920 
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AGAATTGATC ATAACTAGTG TTGTACCATC TTGTTTAAGA ACTTTGTCAA CATCTTCTGC 11040 

AGTAGTTAAT TGCTCATATC CCGCAGATTC AATTTCATTC CTTGCTTGTT CTACAACACC 11100 

5 

GTTCATGTAT AAATCGAAAT TCATGnCCAT AAGTTCAATC ACCTATCCCT TTATATTTAA 11160 

ACTAt CCTCA TTCTACTAAT TAATAACATA TTGTTCAATA AACTAATCTG AATCACACCT 11220 

ATATTTAGAC ACAATTTTAA CAATATACCA AACATTATTG TGCTTAAAAT CATGGTAACT 11280 

10 

AATTTGTTCA CATGTTTTCA TTAATATGTT TCAAGTATGA TGTCTTATTT TGACTTTACT 11340 

GCAAAAATGC ATTCAACCAT GTTGATTATT GTTCTTTATC TTTTTTGAAT ATATTGCACA 11400 

15 TATTTTAGTG CCAAAAAATA ATACATCCAT CGACAAGAAC AAGATAAAAC AAGTTOTCGA 11460 

TAGATG CATC TATGTTATCA CTAATATATA TTTGTATTTT CTAAAGTATA CTGTT CGATA 11520 

CGCTGTTTAA TATGATTCAT Ar ATTTACCT GTTTGTAAAC CATCTAAAAT ACGATGATCA 11580 

20 ATTGAAATAC ATAAATTAAC CATGTTACGA ATTGCAATCA TATCATTAAT TACTACTGGC 11640 

TTTTTAACGA TTGATTCTAC TTGTAAAATC GCTGCTTGTG GATGATTTAT AAT AC CCATT 11700 

GATGATACTG AACCAAATGT ACCAGTATTA TTTACCGTAA ATGTACCGCC CTGCATATCT 11760 

25 

TCAGCTGTCA ATTGCTTATT ACGCGCTTTC GTTGCTAAAG TATTAATTTC TCTAGCTATA 11820 

CCTTTGATTG ACTTTTCGTC TGCATGCTTA ATCACAGGTA CGTATAATTT ATTTTCATCA 11880 

GCAACAGCAA TTGAAATATT AATGTCTTTA TGTAAGACAA TTTCATTTCC TTGCCAGCTA 11940 

30 

CTATTTAATA AAGGATATGC TTTTAAAGCA TCTGCTACAG CTTTTACAAA GAAAGCAAAG 12000 

AACGTTAGAT TATATCCTTC TTTATTTTTA AAGCTGTTTT TATAATGATT TCTCGTATTC 12060 

3S ACAAGATTTG TAGCATCTAC TTCAATCATC ATCCATGCAT GTGGAATCTC TGTTACACTA 1212 0 

TTAACCATAT TTTGCGCAAT TGCTTTACGC ACACCATTTA CTGGTATTGT GCTGTTTTCA 12180 

CTATTGTCTT CAGATGATTG GTTACTTGAT GTATCTACTG ATGTTGATTT TGTTTGAACT 12240 

40 TGTTTGTCAG ATTGAGCTGT GGTACCACCA TTTTCAATAA CTGACATTAT ATCCTTCTTA 12300 

GTTACACGAC CTTCAAATCC ACTACCTACA ACTTGTGATA AATCAATGTC ATGCTCTGAA 12360 

GCGAGTTTAA ATACAACAGG TGAAAAGCGA CCATTATTAC GTGGTTGATT TTGTTTAGCA 12420 

45 GTAGATGTCT GTTCCACTGT TGCACTAGCT TTTTTAGTAG ATTTCTGAGT ATGCTCATCC 12480 

ACTTTTGCTT GTATCTCTTC AGTTGTTTCA TTTGTCTTTT CATCAGCAGT TTCAATTTTA 12540 

CAGATAATTG TATCAATAGC TACTGTCTGC CCCGCTTCAA CTAAAATTTC TGTAATTGTT 12600 

50 

CCTGATATCG TGGAAGGGAC TTCAGCTGTC ACTTTATCTG TAATAACTTC ACATAATGGT 12660 

TCATATTCAT CAATATGATC ACCAACAGAA ACTAACCATT GTTCAATGGT GCCTTCATGA 12720 
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AATTCACGCA TTTTATTTAA GATTTTTTCT GGATTCATCA TAATTTCATT TTCTAATACA 12840 

GGAGAAAATG GCATAGATGG TACAtCTGGA GCAGCTAAAC GCATGATTGG TGCATCTAAA 12900 

TCGAACAAGC AATGCTCTGC AATAATCGCT GACACTTCTG ACATAATACT ACCTTCTAAA 12960 

TTATCTTCAG TTACAAGTAA AACTTT AC CT GTATGTTTAG CACGATCAAT AATTGTTTCT 13020 

TTATCTAATG GATAAACAGT TCGTAAATCA ACGACTTCAA CATTGATACC GTCTGCAGCT 13080 

AAAATATCCG CTGCTTGTAA ACAATAATTG ACCATTAATC CATAACAAAA TACTGTTAAA 1314 0 

TCTTCACCTT CACGTTTCAC ATCTGCTTTT CCTAAAGGTA CAGTGTAATA TTCTTCTGGC 13200 

ACTTCTTCCT TTAAGAAACG ATAAGCTTTT TTATGCTCAA AGTACAATAC TGGATCATTT 13260 

GATTCGATAG ATGATAATAA AAGCCCTTTA GCATCATACG GTGTGGAAGG AATAACAATT 13320 

GTTAAACCTG GCGATGAAGC AAATATACTT TCAATACTTT GTGAATGATA TAGTCCTCCG 13380 

TGAACACOGc CACCAAATGG TGCACGAATC GTTAATGGGC ATTGCCAATC ATTATTTGAA 13440 

CGATAACGCA TTTTCGCAGC TTCACTAATA ATTTGATTTG TCGCAGGTAA AATAAAATCT 13500 

GCAAATTGAA TTTCTGCAAT TGGTCTTTTA C CT AC CAT AG CTGCAC CAAT GGCAGTTCCA 13560 

ACAATATTTG ACTCAGCTAA TGGCGTATCG ATAACTCTGT CTTCAC CAT A TTTTTGTTGC 13620 

AGTCCTTGAG TAGTACCAAA TACGCCACCT TTTCTACCAA CATCTTCACC AAGAATAAAC 13680 

ACATCTTTAT TTTGTTGTAA TGCTAAGTCT TGTGCCtGcG TATCGCCTCT AAAT AAGAT A 13740 

ATTTAGCCAT TAGTTAAGAC TCCCTTCTTC GTACACAAAT GCATAGGCTT CTTCGACACT 13 800 

TGGATATGGC GCGTCTTCAG CAGCCTTTGT CGCTTTATTG ATGATGTCTT TnATgTCCGC 13 860 

TTCTATTTCT GCCAACCAAG CATCATCGAT AATG CCAGCT GAAAGCAACT CTTTTTTGAA 13 920 

CTTTTCATTG CAGTCTGCTT TTTTAAGcGT TTCACGCTCT TCTTTCGTAC GATATTGGTC 13980 

GTCATTCATCT GATGAATGAG CTGTCATAOG ACTTGTTACT GCTTCAATCA AAGTTGAACC 14040 

TTGACCAGAA ATAGCTCGAT CTCTTGCTTC TTTCATCGCT TTATACATTG CTAATGGATC 14100 

ATTACCATCT ACTTGTTCAC CATGTATACC GTAACCAAGT GCTCTATCCG ATAATTTTTC 14160 

AGCTGCGTAT TGTAATGAAT CAGGTACTGA AATTGCATAT TTATTATTTA TAATGACACA 14220 

TACAAAAGGA AGTTTGTGTA CACCCGCGAA GTTTAAACCT TCATGGAAGT CACCTTGGTT 142 80 

TGAGCTACCT TCACCAACAG TTGCTGTTGC AATTTTCTTC TTACCATCCA TTTTTAAAGC 14340 

TAAAGCAGCA CCAACAGCAT GGGGTATTTG AGTTGCTACC GGTGAACTTT GAGACAAAAT 14400 

ATTCTTAGCT CTACTACTAA AGTGTGATGG CATTTGTTTT CCACCAGAGT TAACATCGTC 14460 

TTTCTTTCCA AACGCTGATA AAAACGTATC ATACGCTGAG ATACCCATAT AAGTAACGAA 14520 
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AATCTGAGTT GCTTCTTGTC CTTGACCACT TACAACAAAT GGAATTTTAC CTGCACGGTT 14640 

CAATAACCAC AGTCTTTCAT CTATTTTTCT ACCTAAATCC ATCCATTTAT ATATTACTTT 14700 

TAGGTCTTCT TCGCTAAGGC CTAATGATTT ATAATCAATC ATGTTAAATC CTCCTATTTA 14760 

TACGTGAATA GCTCTACTTT CTGCTTTCAA TCCTAATTCC ATCAACACTT CAGAGATGGA 14820 

AGGATGTGCG TGTGTTGTTA GTCCTAATTC TAATGCCGAG CCATTCATGA ACTGTAACAG 14880 

TGATGCCTCA TTAATCAATT CTGTTACATG TGGACCAATC ATATTAATAC CCACAATTTC 14940 

TTCAGTTGAT TGATCAATCA CCATTTCGCT ATACCCTTCG TTTGTGTCAT GGCTATCAAT 15000 

CACTGCTTTA CCAATTGCTT TAAATGGTAC TTTAAAACTT TTAACTTTCA TTCCCTCTGC 15060 

CTTTGCTTGT TCAATGTTTA AACCGATAGA AGCAATTTCA GGTTGTGAAT AAATACACTT 15120 

AGGCATCATG TTATAGTTTA CTGGGATTGG GTTCCCCTCA AACATATGAT CAACAGCCAC 15180 

AACACCTTCT TTTGATCCAA CATGTGCCAA TTGTAATTTT CCTATACAAT CACCAGCTGC 15240 

ATAAATATGT TTATCTTCAG TTTGTTGAAA TTCGTTCGTT AAAATATGTC CTGATGTTGa 15300 

AAGt TTTATT TTAGTGTTGT TTAAACCAAT ATCTGATGTG TTAGGTTTTC TACCAATCGA 15360 

TAGCAACACT TTATCTACTT TAATTATGTC TGAGGAAATT TCAAACGTAA CACCATCTTC 15420 

GTTAACATTT ATATCATTTT CAGAAAGTTT TATTCCCTCA TAGAATTTAA CACCACGTGC 154 80 

TGACAATGAT TTTTTTAATA GTTGTGAAGC TTGTTTACTT TCAGTTGGTA AAATTCTTTC 15540 

ACCTGCTTCT ATAACTGTTA CGTCAACACC TAAATCTATC ATCAATGATG CAAATTCCAT 15600 

TCCGATAACA CCACCACCAA TAATACCAAT ACTTGATGGT AAOGTCTTTA ATGATAATAT 15660 

ATCATCGCTA GATAAAATTT TATCATGATC AAATGATAAG AATGGCAACT CTGCAGGCGA 15720 

AGAACCAGTT GCAATTAATA CAAATTGGTT GGGTAATAAG TCTGATTCAC CATCTTCATA 15780 

TTCGACAGAA ATTGTGCCAC TTTGAGGTGA AAATATAGAT GTACCTAGAA TACGTCCCGT 15840 

GCCATTATAA ATGTCAATGT GATTGTGTTG CATTAAATGC TTTACACCTT GATACATTTG 15900 

ATTAATAATG TCTTCTTTTC GTGCCAACAT ATTTTCAAAA TTAACATTAG CATCTTTGAC 15960 

ATCAACGCCA AACATTGCTG CCTGTTTTAC TGTTTGAAAT ACTTCAGCAG ATTTAAGCAG 16020 

CGATTTAGTA GGAATACAAC CTTTATGGAG ACAAGTACCT CCTAATAGTT GTCGTTCTAC 16080 

TATTGCCACT TTTTTACCTA ATTGAGACGC ACGTATCGCA GCAACATATC CTGCAGTACC 16140 

TCCACCGAGA ACGACTAAAT CATATTGTTT CTCTGACATG TTCTTACTCC TAACTAATGA 16200 

TATATATCCA TTGAAAATTT ATTAATACAT AGTTTTCATG TCCATTAATT ACCTATTTTA 16260 

CATGATTGTC TATTTAGTTT GAATGCACAT AAATAAATCC ATAAATGAGT ATTCAACACA 16320 
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TAAATCAGTA ACACTTGCAC CTGAAATCAT TCGTGCAATT TCATCTACTT TATCATCGCT 16440 
AATTAACTCT TGAACTTGTG TTGTTGTACG ATCATCTTTT GATGATTTCG AAATTAATAA 16500 

5 

ATGATGGTCG CTCATCGATG CAACTTGTGG TAAGTGAGAG ATACAAATAA CTTGTATATA 16560 
TTCTGCTaTA TCTCGCATTT TCTCTGCCAT TT 16592 
(2) INFORMATION FOR SEQ ID NO: 54: 

10 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 13794 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
is (D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 54: 
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CCAATACAAC 


GTAAAAAGAT 


TGCTTGTGTT 


ATTAATGAQi 


lAuAlAAAAl 


A ATTAAAHftA 


60 


TTTAATAAGG 


AAAGAGACTA 


CATAAAATA 1 




r*AAAATATAfs 


f* A A Af5 AT^ TTT* 


120 


TTTATACTTT 


TTATGAACAT 




AAAUAl 1111 


TAAAATATCG 


A TTTA ATTTA 


180 


ACATTTCTTG 


ATTTATCTAT 


CTTATATGTA 


ATATCATCTC 


GAAAAAATGA 


GATACTAAAT 


240 


TTAAAAGATT 


TGTTTGAAAG 


TATTAGATTT 


ATGTATCCTC 


AAATTGTTAG 


GTCAGTTAAT 


300 


AGATTAAATA 


ATAAAGGTAT 


GCTAATCAAA 


GAACGATCCC 


TTGCAGATGA 


AAGGATTGTG 


36.0 


TTAATCAAAA 


TAAATAAAAT 


ACAATATAAC 


ACTATTAAAA 


GCATATTCAC 


AGATACTTCC 


420 


AAGATTCTCA 


AACCAAGAAA 


ATTTTTCTTT 


TAAATTTAAA 


CAGATTTACC 


TCTTGATAAA 


480 


ATAAATAAGC 


AATCATACTA 


CTTCTCAATT 


TAGTATAAAT 


AAAAATACAT 


AATTAACTTT 


540 


CTTTTGTTTT 


TATATTATTT 


CAATACCCTA 


CTATATATCA 


CAACACATAA 


ATTAAGCATG 


600 


ACACTCATTC 


AATTTAGTTC 


ACCATTTCGT 


GTTCCAATTT 


TACTGAGTAT 


CATGCTTTTA 


660 


ATGTTATAAA 


CCTAATGCTT 


TAATAAATCG 


TGTTAATTCT 


TCTCGCATAC 


TGTCATCTTT 


720 


CAATGCATAT 


TCTATGGTAG 


TTTTAACGAA 


GCCTAATTTT 


TCTCCAACGT 


CATAACGTTC 


780 


GCCTTCGAAG 


TCATATGCAT 


ACACTTGGTT 


ATCATTATTC 


ATACGTTCAA 


TCGCATCTGT 


840 


TAACTGAATT 


TCGTTACCTG 


CGCCTTCTTT 


TTGCGTTTTT 


AAATAATCGA 


AAATTTCAGG 


900 


CGTTAATACA 


TAACGTCCCA 


TAATAGCTAG 


GTTTGATGGT 


GCCGTACCTT 


GTGCTGGCTT 


960 


TTCAACAAAC 


TTTTTCACTT 


CATACTGACG 


TCCGTTTTTA 


GTTAATGGGT 


CAATAATTCC 


1020 


ATAACGATGA 


GTATCTGCTT 


CCGGAACTTC 


TTGGACACCT 


ATAACTGAGT 


GCCCTGTTTC 


1080 


TTCATAAACG 


TCAATCAACT 


GTTTCACTGC 


TGGCACTTCA 


GATTCAACAA 


TATCGTCACC 


1140 
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TAAACCTTTT TGTTCTTTCT GCCTTACATA 
AACTTTCTCT AGTAATTCAG ATTTACCTTT 
5 ACTATCAAAA TGATCTTCAA TCGCGCGTTT 

AATTCCAGCT CTTGCAGCTT CTTCAACGAT 

AAGCATTTCC TTTGGCATCG CTTTAGTTGC 

10 

GGGAATGATT GCCTTTTTTA TTTTTTTCAA 

ATCTATGTAT CAACGTCATT TTAACACTAA 

GTAATTATTT CTTGGGAAAT TTGTTTTAAT 

1S 

ATGAAATAAA CCTGTCAATT TTGGATTGAT 
AATAACGCTA AACCTAAAAT GCTAAATAAT 

2 0 TCTTCTCCAC CTGTTTCAGG TAGTTCAGAT 

ACTGCTTTAA CCTTTTCATT GATTTCAATA 
GGTTTAGAAG GTTTTTTAGG TTCTTCTTTA 

25 GGTACCTCTG GCGTTGGCGG TGTTGGTGTT 

GGTGTTGGTG TTTCCGGCTC GCTTGGTACT 

GGAGGTGTTG TATCTTCTTC AATCGTTTGT 

30 

AGTGTATCTT CTTCAAAGTC AACACTATTG 

TTATTTGTAT CTTCTTCAAT AATTTCAGTG 

CTGTCGAAGT CGATATCAAT GATATTACCA 

35 

GTATCTTCTT CGAATGATTG GTTACCATTA 
AAATCGATAT CTACGATATT GCCACCTTGT 
TCCTCAAATG ACTGATTACC GCTATTTTGG 

40 

TCCACGTGGC TATTTTCTTC GATTTCTTCA 
GTTCCTAAAC CAGAATGAGA AATATGATGA 

45 TGCGCTTGAC CATGTTCTTC AGGTAGTTCA 

GTATATTCTT TCGTATCTTC AATTGTTGTA 
TTTGTAGAAT CTTCGTCAAA TTCAACTAGG 

60 GGGTTTGTAT CTTCTTCATA TTCAACAACA 

GATTCTTCAA AGTCTACATG AATAGAATCT 

55 



AAAAATATTC GCAAGTTCCG TTGAATACTG 1260 

TTCTTTTAAC ACCATTTCTA ATTCTTTTTG 1320 

GTGGCGACCT GTCACTATAA TAATATCTTC 1380 

ATATTGTATT GTGGGTTTAT CTAAGATAGG 1440 

TGGTAAAAAT CTAGTCCCTA AACCAGCAGC 1500 

AGTTAATGTG CTCCTTTTCC TAAGTATTAA 1560 

TTAGAACGCC TTCATAGTGT CATTGAGTAT 1620 

TTTAAAAAAC AGGCTTACTT CATATAATTT 1680 

TATGCTTTGT GATTCTTTTT ATTTCTGCGT 1740 

CCGCCGAACA ACATGCCGTT GTTTGTTGAT 1800 

TTCTTAGATT GTGCTTTTTT AGTTGGTACC 1860 

ACAGGTGTTA CTACTTTACC TTGTTCCACT 1920 

GCAGGTGGTA TTGGTTTACC AGGTTCAGTT 1980 

TCCGGCTCGC TTGGTACTTC TGGTGTCGGT 2040 

TCTGGTGTCG GTGGCGTTGG TGGCACGATT 2100 

TGACCTTCAT TATGACCACT TACTTGTGGA 21^0 

TGTCCACCGA ATTGATAATT TGGTTTATCT 2220 

TGCTTATTGA AT CCGTGAAT ATGTGGCACA 2280 

CCTTGTTCAT ACTTAGGTTT GTCTTTCTCT 2340 

TTTTGACCAT GAATTTGAGG TACACTATCG 24 00 

TCATATTTCG GTTTATCTTC TTCTGTGTCT 24 60 

CCACCTTCGT AACCTAATTC ACTCTTAATA 2520 

ATCACGCCAT AATTACCGTG ACCA T TTTCA 2580 

TTGTTTTCAG TAATTTCCTC GATTGGTCCT 2640 

TCTACTAGTT CAATCAGATT ACTTTCAGTC 2700 

TGATCGCTAA CAGCACCAGT TACAATACCT 2760 

TTAGACTCAG TAGTAACCTG ACCACCACCT 2820 

TCAGCATGAT GTTTTGAATT TTCATGTGTC 2880 

TCTTCAGTTT CAATGGTACC TTCTGCATGA 294 0 
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TCTTCGATTG TACCAGTCAA TTCATGCTTC TCCACTGGCG GCTCTGATTT AAATTCAAGT 3060 

TCGATAGGAG TACTATGTTC TATAATAGGT TCCTTTAGTT TATCTTTGCC GTCGCCTTGA 3120 

GCGTTATTAG AGTAAAATGC AACGCCATTT TTCCaAGTTA AATTACTTGT ATAATAATAG 31B0 

TTATAATATC CAAAAAGGTG TGTTTGAAAT TCTAAGTTGC TAGCATTTGA ATCATAATAC 3240 

CCTTCATATT TTATTACATA ATTTTTACTT TGGTCTAAAT TATTAAAGTT TAAAGAATAA 3300 

CCACCATTAG TATCAAAATC TAAACTCATA TTATCAGTCA CATCTTCAAA TTTGCTGACA 3360 

TCATCAAGCT TTGCATAnTn AgctTTCAGC TAAATCGTCT GAACCAATGT GTTTATATAC 3420 

15 CTTAACTGTT GGATTATTAA CCCCTGGTTT ATTTCCTTTA GTTACTTGAC CAGTTACTGT 3480 

CACAGAGCTT AAOGACTGGT TGTTAGGTTT CATOTACGCA AAATGACTAA ATTTCCCATC 3540 

TACTTTATTT AAAGTATCAA TTCGACCATT AGCTGTTACT CCCCAATTAT CTCTAACTCC 3600 

20 ACCTAAATAT TGAATATTAA ATATTTTGCT AACCGTAGTC TCACCCAATT TAACTTCAAC 3660 

ATTTTGGTTA CCTTTTTGCG TCACTGTTGT AGGATCAATA AATAGATTTA AAGATAATTC 3720 

AGCAGTTAAA TCTTTCTTTT CTTGTACATA TTCTTTAAAC GT AT AT CT AA CTTTTCTTTC 3780 

TCCAATTATT TCTCCTGTCG CCATAACTTG ACCATCTGTA CTTTTTATCT CCGGAACTTT 3 840 

ACGCAGTGTT GAGATACCAT GAGTTTCAAC ATTATCGCTT AATGTGAAAT CAAAATAATC 3 900 

TCCCGCCTTA ATTCCTTCTC CAAATTTCCA TTTATATTTC AAGGTTACTC TTTCTGCGTT 3 960 

ATGAGGATTT ACAACATTCG TATCTTGTTT ATGTCCTACA ATTT CACTAC CTTCTTCTAC 4 020 

TTCCACTTTA TTTGTTACAT CTGTACCTGT CGCTTTAGTT T CTTCCACT A CTTCTTTCTC 4 0 80 

TGCAACTGCT GTAACGTCAt TGatCTTTTC ATTCTTGGTT TAATTTCTGA GACGTTACTT 414 0 

GGTTGAGCTA TGTCAACTTG AGTTC CTGT A GTTTCCTTAT CAGCAACTTT TTCCGATGGC 4200 

AAATCAACTC GCGAAgTTTC TACTTTTGGT GCTTGCAcAG TTTTCGGTGC TTCTTCTGTT 4260 

40 GTTACTTGTG TTGATTGTGA TGGTTGCTCA GTTGATG TCG CGCTGTATGA TTGTGTTTCA 4320 

TCTATTGTAT TAACGTTATT TGTAGTTGTT TGTGTTTCGC TTGCTTTACT TTCAGTAGCT 4380 

GAACTCCCAC TTTCCTCTAC TGTAGTATTG TTTTGTTCCG ATGCTGCAGC TTCTTTTTCT 4440 

45 TGTCCCATTC CAACAACGAT CATTGTTCCT AAGAATACTG AGGCCGCTCC CAATTTGTGT 4500 

TTTCTTATGC CGTATCTAAG ATTGCTTTTC ACTATAATAT TCTCCCTTAA ATGCAAAATT 4 560 

CATTTATTTT TAAAACTCAA TAAATGCAAT TCTATATTGT TCGGTTTTTA AAAGCAATGA 4620 

50 

AAAAAAGCGA GTTAATAAAA AGTTAAGATT GTTGTTAACT TTATGTATAA TGAGTTTTTT 4680 

ATTATTTGAA ACTCACATAT AT ATTG CAT A CAAAGCTCTT GAACACCTTG ATATAACAGG 4740 
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TACTAAACCA TACATAATAA TCGCCTGTAC AATGCATCAT TAACAAGTCA CTGAAACGCC 4860 

TTTCATTGTA TTAATAACGT CACTATAATT TTTATATCGT TCGGTTTTTG TTTGATTTTA 4920 

ATGATTATTT ATACAAAAAC AGCCGTATTT CAAGCCGACA TTTTAAATTT AACTAAATTT 4 980 

GCATCTAGTT AATAATTGCA TTTATCAAAT TTGTCTTATT GATCCAATCT AATTTGTACT 5040 

CACAAACTAG TTTAAAATTC TAACTTTATC TCTCAGTTCG TTATCAATCA TCAGACATAA 5X00 

ACCAATGAAG CAATCAGAAA ACACTCTAAT TTTCTATTAG AAATTTGATT TAATATAAAA 5160 

AAACAGGCTT ACTTCATATA ATTTATGAAA TAAACCCGTC AATTTTTGTT TAATTATGCT 5220 

TTGTGATTCT TTTTATTTCT GCGTAATAAT GCTAAACCTA GAATGCTGAA TAATCCGCCG 5280 

AACAACATAC CTTTGTTTGT TGATTCTTCT CCACCTGTTT CAGGTAGTTC AGATTTCTTA 5340 

GATTGTGGTT TTTTAGTTGG TGCCACTGCT TTAACCTTTT CATTGATTTC AATAACAGGT 5400 

20 GTTACTACTT TACCTTGTTC CACTGGTTTA GAAGGCTTTT TAGGTTCTTC TTTGGCAGGT 5460 

GGTACTGGTT TACCAGGTTC AGCTGGTACC TCTGGTGTTG GCGGTGTTGG AGTTTCTGGC 5520 

TCACTCGGCA CTTCTGGTGT CGGTGGTGTT GGTGTTTCCG GCTCACTTGG TACTTCTGGT 5580 

25 GTTGGTGGCG TTGGTGTTTC CGGCTCACTT GGTACTTCTG GTGTCGGTGG CGTTGGTGGC 5640 

ACGATTGGAG GTGTTGTATC TTCTTCAATC GTTTGTTGAC CTTCATTTTG GCCGCTTACT 5700 

TTTGGAAGTG TATCTTCTTC AAAGTCAACA CTATTGTGTC CACCGAATTG ATAACTTGGT 5760 

30 

TTATCTTTAT TTGTATCTTC TTCAATAATT TCAGTGTGCT TATTGAATCC GTGAATATGT 5820 
GGCAGACTGT CGAAGTCGAT ATCAATGATG TTACCGCCAT GTTCATACTT AGGTTTGTCT . 5880 

TTTTCTGTAT CTTCCTCGAA TGACTGATTA CCTTTATTTT GACCATGAAT TTGAGGTACA 5940 

CTATCAAAAT CGaTATCTAC GATATTG CCA CCTTGTTCAT ATTTAGGTTT GTCTTCTTCT 6000 

GTGTCTTCCT CGAATGACTG GTTACCGCTA TTTTGGCCAC CTT CAT AAC C TAATTCACTC 6060 

TTAATATCAA CGTGG CTATT TT CTT CG ATT TCTTCAATCA CGTCATAATT CCCGTGACCA 6120 

TTTTCAGTTC CTAAACCAGA ATGAGAAATA TGATGATTGT TTTTAGTAAT TTCCTCGACT 6180 

GGTCCTTGTG CTTGACCATG CTCTTCAGGT AATTCATCCA CTAATTCAAT CAGATTACTT 6240 

45 tCAGTTGTAT ATTCTTTCGT ATCTTCAACT GTTGTATGAT CGCTCACtGC GCCAGTTACA 6300 

ATACCTTTTG TAGACTCTTC GTCAAATTCA ACTAAGTTAG ACTCAGTAGT AACCTGACCA 6360 

CCACCTGGGT TTGTATCTTC TTCATATTCA ACAACATCAG CGTGATGTTT TGAATTTTCA 6420 

SO 

TGTGTAGATT CTTCAAAGTC AATTGGATTT GATTCCTCAG AGGACTCAGT GTATCCTCCA 6480 

ACGTGACCTG ctTCGCTATC CACAGCAGTA TGGTAATCGA TATCAATAGC TGATGAATCC 6540 
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TGGTAATCAA TGTCAAGAGT TGATGAATCA TATTCCTCTT CAACAGTAGT TACTAAATTC 6660 

TTATCATATT GACCTGTAAG AGTTTCTTTA ATTGTATCTT CTTTATATTC AAATTTATTA 6720 

TTTTGAATAA TCGGACCATT TTTCTCATTT CCGTTCGCTT TATTACTGTA TAAAACTAAA 6780 

CCATTATCCC AAGTTAAGGT ATATCCTCTA TCATAATAAT ACTTATAAAG TTGCTCTGGA 6840 

TGTCCTACCA TTTGTGTTCT AAAATCAACT TCATCAGTAC CATTTAAATA CTCTCCATCA 6 900 

TAGTGAACAA CATAAGTTTT ATCTAGATTT TCTATATTCA ATGAATAGCT TCCATTATTT 6960 

TGTAAATTCA AATTCCCACT CATATTACTT GTGACTTCTT TAAATTTAGA AGTATCTGTC 7020 

GTATTTGCAT ATACACTCTT CGCTATGTCT TCATTATTAC CCAAGTATTC AAATATCCTA 7080 

ACTTTTGGTT GATTTCCATT CTGATTACTA CCTTTCATTA AAGTTCCAGT AACAGTCACA 7140 

CTTGTOGTTT TACCATTATT AGGTTTAATA AATGCAACAT GCGAAAATCT ATTATTOGCT 7200 

20 TTATTAAATG TCTCAATCGA TCCATTTAAA TTGGCATAAT AATTCCCAAT ACCATCTTTA 7260 

TATTTAACAT CTAATTCCTT TGAAGTTTGT TCTTCATTTA GTGTTGAAGT TATAGTTTGA 7320 

TTTCCATTAG TTTGTACAGT TTTAGGATCA ATAAATAAAT TAATTTCTAG TTCAGCCGTT 73 80 

ACATCAACCT TATCTTCAAT ATCATTTGTA AATGTATATC TAATCTTTCC ACCTTCTAAA 7440 

ACTTCACCTG TCGCCATTAC GACTGAACCA TTTTTAATTT CTGGTACTTT TCTAGCAGTT 7500 

GATACGCCAT GCGTATTTAC ATTATTTGAT AAAGTAAAGT CAAAGTAGTC ACCTTGATGT 7560 

AAACCATTCT CAAATTTCAA CTTATATTTT AGTACCG CTC GTTGTCCTGC ATGAGGTTCT 7620 

ACTTTATTTG TATTGTTATG CCCCTCAATA GAACCAATTT CTACTGTAAC TTTACTTGTT 7680 

ACATCTGTAC CCGTTTCCAC TTTCGCGTTA CTAGCTTCCT TAGCTTCCGC TACATCTGCT 7740 

GATCTTGTCA CACGTGGCTT ACTTTCTGAT GCCGTTCT TG GCTGTGCCAC " TTCAACTTGT 7800 

GTTTCTGCGA CTTGATTTTG TGTAGCCTTT TTAGGTGTTA AATCTACTTG TCTTTGATCT 7860 

40 CCGCTATTGT CTTGAGATTG TGTTGTTTCC TTAACTTGAG GTTTCGCTTC TTCCTTAACT 7 920 

ACCTCTTCTT TAACTGTTTC TATATTTGCT GGTTGTGCAG TTTGTGGTGC TTGTACTGCT 7980 

TTTGGTGCTT CTTCAGTTGT TACTTGTGTT GCGTTTGACG GTTGTTCTGT TACTGTTGCG 8040 

45 TTATATGATT GAGTTTCTTC TATATGATTA ACGTTAGTTG CAGTTGTTTG TGTTTCACTT 8100 

GTTTTATTAT CAGTAGCTGA ATT CCCATTT TCTTCTACTG TAGTTGTCTT TTGTTCTGAT 8160 

GCTGCAGCTT CTTTGTCTTG TCCCATCCCA ACAACGATCA TTGTTCCTAA GAATACTGAT 8220 

50 

GCTGCTCCCA ATTTATGTTT TCTAATGCCG TACCTAAGAT TGTTTTTCAC TATAATATCT 8280 

CCCTTTAAAT GCAAAATTCA TTAATTTTTT AAACTTAATA AATGCAAGTC TATATTGTTC 8340 

55 



25 



30 



35 



417 



EP0 786 519 A2 



ATGTTAATTQ ATAATTTTAT TATTTQAAAT 
AACCCTTGTC ACACAAGGCT TGTATTTTTT 
5 ATCTAATTTA AAACAATATA CTAAACGTTT 

AACATGTCTT GAAACGCCTT TCATTACTCT 
GGATTCTGAG TATTTCAGAC GATTTTCTGC 

10 

TTGCAATTAC CTAAAAACAC GTTTACTTAA 
AAATGAAGAT GATACCTGAA ACGGAAATAA 

1S TTTCTTTTAC AGTTAAACCA AAATATTCTT 

GAGACAAAAT CACACTACCT GCACCTATCG 
ATGATTGTAA TAATGGTAAG ACAATACCTG 

SO CTAATGCGAT ACGTAGCACA GCTGCAACAA 

TACCTTCAAA CATTTTAGCA ATTGTATTTC 
ATGTACCGCC ACCGCCAATA ATCAATAACA 

25 CTGATTCCAT AATATGATTC AT CTTACGCT 

ATAATACTGC TATTAGCATG GCTGTCCCTG 
ATAGATTTGT AGGTTTGTCA TGCCCAGTTA 

30 

ATATGACTGG TAATGTTGCT GTTAATAAAC 
TAAATTCTTT TTGTGCACCT AACGCTGAAA 
TCATTTTTTG TGCAcTTTGT TAAATATAGG 

35 

AATCATACCA TACAGTAATA CATCTCCAAC 
CGGTCCTGGA TGTGGTGGTA AAAAGCCATG 
TCCTAGTTTT AACACTGAAA CATTTGCGCG 
TAAGACTAAA CCTACTTCAA AGAACAATGC 
TGCCCATTGT ACATGTTTTT GACCAAATTT 

45 ACCACCACCA TCAGCAAGCA ATTTCCCAAG 

GTGGCCGAGC GTACTGCCCA TTCCTTTCTC 
ACCTAGCATT AACGCTGTAA TCATCGATGT 

50 AAACCCAATA ATTAATACTA ATAAAATAAC 

TATTTCGTTA AACATGACAT TCCCCTCTTT 

55 



ATACCTATAA ATTGTATTCA AGTCATCAGA 8460 

ATACTTATTT TTTAAATTAA ATTCATCATT 8520 

CATAATTATC GCCTGTACAA TACGCACAAA 8580 

AAAATACCGA ATATACTTTT TATATCGTTC 864 0 

ATAAAAATAA ACGTGTTTCA AGGCAATATA 8700 

TATTTAGTTA AACAAATAAG CTAATGAATA 8760 

TCGTTTCTAA TAATGACCAT GTTAAGAATG 8820 

TAAACATCCA AAATCCTGCG TCATTTACAT 8880 

CAAGTACAAC TAATGCAACA TTTACATCTG 8940 

TAGTTGAAAT CGCAGCTACT GTAGCCGAAC 9000 

TCCATGCTAG TAAAATCGGA GACATCTCTG 9060 

CGACACCGCC GTCAATTAAT ACTTGTTTAA 9120 

TCATTCCGAT TGGATAAATC GCATTCGTCA .9180 

TTCTCATTAA TCCCATCGTA ACGATTGCAA 924 0 

CTGTTCCTAT CATATAAATG ATAGATTCAA 9300 

CAAGTTGCGT TATCGTAGAC ACTAACATTA 9360 

TCATACCAAA TCCTGGCATC TCTTGATCCG 9420 

TATCGCCTTC TCGTGTATAC GCAGACGGAA 948 0 

CCCTGCAATG AGTGTAACTG GaATGGCAAT 954 0 

ATTTGCCTTT AATTCTTTTG CGATGACTAC 9600 

TGTCACTGAT AAAGCTGTTA C CAT AGGTAG 966 0 

TTTTGCTACT GTAAATACTA ATGGAATCAG 9720 

AATACCGACG ATAAATGCTG CAACAAGCAT 9780 

TTGAATCAAC GTGTCTGCGA TTCGAGTTGC 9840 

TATGGCACCT AAACCGAATA TCAGTGCAAT 9900 

AATCGTCTCC ATAATTTTAG TCAATGGTAT 9960 

GATAATTAAT GAAATAAATG TATTTAATTT 10020 

GATACCTAAA ACAACACTGA TTAACGGCCA 10080 

CTCTTTTCAA TAGAATGTAA CACOGTCGTC 10140 



418 



EP 0 786 519 A2 





GAGTGACGTA 


TTTATTGTGT 


TTTATTTTCA 


GCGATATGTT 


GGCGTTGAAA 


ATCTGCAATT 


10260 


5 


TGTTCATAAT 


TCTCTGTTAA 


AGAACGACTT 


AAATTGATAA 


AAATGGATAC 


GATCTCTTGG 


10320 




TAAACAGTGA 


CATTTTCTTC 


AATCGGCGTA 


TGATTGTTTG 


TGGCACCGAC 


CATCGATGAA 


10360 




ACGATTGAAA 


AATCTTCAAT 


GTCACCTACA 


GCTTTAAGTC 


CGAGCACGCA 


GGCACCTAAG 


10440 


10 


CATGAACTTT 


CATAACTTTC 


AGGAACCACT 


AACTCTGTGT 


CAAATATATC 


TGACATCATT 


10500 




TGACGCCATA 


CTTCACTTTT 


CGCAAAACCA 


CCTGTTGCTT 


TTATCATCTT 


AGGTGTTTCA 


10560 




TTCATTACTT 


CAATAAGCGC 


AAGATAGACG 


GTATACAAAT 


TGTAAAGAAC 


ACCTTCTAAT 


10620 


IS 


GCAGCGCGAA 


TCATATGTTC 


rrrriTATGA 


GATAAAGTTA 


AACCGAAGAA 


TGAACCTCTT 


10680 




GCATTTGCGT 


TCCAAAGCGG 


CGCACGTTCT 


CCTGCTAAAT 


AGGGATGGAA 


TATTAAACCA 


10740 




TCTGCACCTG 


GTTTAACACG 


CTTTGCAATT 


TGAGTTAAGA 


CATCATAAGG 


ATCAACACCG 


10800 


20 


AGACGTTTCG 


CAGTTTCGAC 


TTCACTCGCT 


AGCAACTCGT 


CGCGCAACCA 


TCTCAATACG 


10860 




ACACCACCAT 


TATTTACAGG 


ACCTCCGATG 


ACGTAGTGGT 


CCTCTGTTAA 


GACATAACAA 


10920 




AATATTCTAC 


CTTTGTAATC 


AGTACGCGGT 


TTATCTATCA 


CAGTACGAAT 


CGCCCCAGAT 


10980 


25 


GTACCGATTG 


TGACAGCAAC 


TTCTCCTTTA 


CCAACACTAT 


TGACACCTAA 


ATTAGAAAGG 


11040 




ACCCCATCAC 


TCGCACCAAT 


AACAAACGGT 


GTATCTTTAT 


TAAGCCCCAT 


TAATGTTGCA 


11100 


30 


TAACGTTCTT 


TCATACCTTT 


CAtCACATAC 


GTTGTTGGAA 


CTAATTCCGG 


CAACATTTCC 


11160 


TTGGAAATAC 


CCAGCAGTTC 


TAATGCCTCA 


ACATCCCAAT 


CTAATGTTTC 


TAAATTAAAC 


11220 




ATCCCTGTTG 


CGGAAGCCAT 


TGAATAATCA 


ATGATATATG 


TATCAAATAA 


ATGATAGAAA 


11280 


35 


ATGTATGTTT 


TAATATCTGC 


AAACTTAGCA 


GTACGTTGAA 


ATACATCTTG 


CCATTCATGT 


11340 




TTCATCCAAA 


AAATCTTCGC 


TAATGGCGAC 


ATAGGATGAA 


TCGGTGTGCC 


TGTTCGCTGG 


11400 




TAAATCGCAT 


TGCCATCATG 


CACTTCATTT 


ATTACTGTTG 


CATATTTTGC 


AGCGCGGTTA 


11460 


40 


TCTOCCCAAG 


TAATATTATT 


TGTTAATCTT 


TGATGTTGCT 


GATCCATCGC 


AATCAAGCTA 


11520 




TGCATTTGCG 


CACTAAATGA 


CACAAACTTA 


ATGTCGTCTT 


TATTAACTTT 


GGATTCTCTC 


11580 




ATAACATATT 


TAATAGTCAT 


TAGTACTGCA 


TCAAATAATT 


CATCTGGGTT 


TTCTTCTGAG 


11640 


45 


ACATCAACGT 


TTGGTGTGTG 


TAAATCATAG 


CCTATTTGAT 


GTTTCATGAT 


AAAAGTTCCA 


11700 




TTTTCATCAT 


ATAAGACTGA 


CTTGGTACTC 


GTCGTTCCAA 


TGTCGACACC 


AATCATATAT 


11760 


SO 


TTCATGATAA 


ATCCTTCTTT 


CTTTCATTTT 


AATTCAACCA 


AAATCCTTCA 


ATATCTTTAC 


11820 


CAACATCGTC 


GAAATTTAAA 


TGAAACGCTT 


CTTTCAAAAT 


TTGACTGTCG 


TATTGTTCCA 


11880 




CTGCATCAAT 


AAACACTTGA 


TGATTATGAT 


GTATGCGTTC 


AAAATCTTGC 


GGGTTCTGTT 


11940 



55 



419 



EP0 786 519 A2 



10 



15 



20 



2S 



30 



3S 



40 



45 



60 



AAAATGAGTT 
CATGCTTCGT 
GTTTCTTCAT 
ATGACTCTAA 
ACACATGTGC 
CATCTCGAAT 
ACGTACCTTC 
CTCCAGTTGT 
CTTCATTACA 
CGCTTTCTTT 
TGGTCACTAT 
CTGTACTCAT 
ATTCGAATCG 
AGAATATATG 
CACCAATGCC 
TCAAAATTGC 
AAATGTTACG 
TTAAGTGTGT 
TGTTTAATAC 
GTAAAGTATT 
ACGC&CAACC 
TATACACACG 
AATATTGAAT 
TAGACATAGA 
ACAATTTCCA 
CCATGTTGAT 
TATTTCAGAA 
TTTCAGTAAA 
TAAACTTGcC 



TAAATATTGA TGATTAGATG 
AAATGATTCT GCATCCTCAA 
TTCTTTTACG ATAGGTAGTC 
CATCAGTCGC AAATCATACA 
ACCCATTCTT TCTAATTGGA 
TGGCGAACGA CTCACATTAA 
AGCTATGTGA CCATTCACAA 
CATACCTTCC AACCATTTCT 
CGACATACTT GTATACAAGT 
ACGAGCACTA AAATAGTGAC 
CACACGAATG ATTTAATTGT 
ATGCGCTTTA GGTACTTCAA 
ACGTGTTGTC GGTGTATGTT 
CTGGCAGTTA GGACATAAAT 
ATAACCAATC ATAAATGGTA 
ACTTATAATG CTAGAATATT 
ACGAATACTT TTCATTTCAG 
GATTGGAGAC GTCGACGCTT 
CGCTTGTTGC TGTTTAACTT 
GAGCGTCTTC AAAGT AC CTT 
TAAATCTTTA AGCAATAAGA 
ACGCTTTCCT TCTGTAAATC 
CGTTCGTGTT GTCACATTGC 
TTCCACCTCC TATAATTACC 
CATTTTAAAG AAATTTATTA 
TTACAAACTC ACTCAAACTA 
TGAATTTGTT GTAATTTATC 
TCTCGATACT TTTCCGTCTC 
CACATATCCA TACCTATCGT 



CTTTGATTAA TGTTTCATGA AATTCAAAGT 12060 

ATTTTACTGC CACTTTCATC ATTTCAAGTT 12120 

GCTCTTGATT TTTAACTCTT GAAAATGCAA 12180 

TTTCTTTCTT TTCTTGTTCC CCAAACGGCA 12240 

TGAGTTGATT TTGTTGCAAT AATTTAAATG 12300 

ATTGCTTTGC CATTTGATTT TCAGTGAGTA 12360 

TGCCTAAGCG TAATTCTGCC GCGATACCTT 12420 

CTGGATATCC ATACATCATC AAAGTCACTC 12430 

ATGTTAATAT AGTTATTATG AGTTTGCAAG 12540 

CACCCCTTTT CGATTTAAAT TTAAAGGAAA 12600 

TATGTTGTAT GTGGGATATT TCTAATTGTT 12660 

TGCAATAATG CGTTTCATGA CAGTTTGGAC 12720 

TCGCTTTGAT AACTGCCCAC AAAGATGGTG 12780 

AGGCAACCTT TTGTTGGTAA TAAAAAGTAA 12840 

AAGCAATTAA AAACGGCCAT TTATTTTTCA 12 900 

GAATTATTCC TATAATACCA GCACTAATCC 12960 

CTGATTTACT GATGACATGC TCTATGTCTT 13 020 

- CATTTACGTA ATATTGAACA TTTTTAATTT 13080 

GTTGGTTAAT TTCTTGTTGT TTCATAGTTA 13140 

CACCTTTTAG CAACATATCT ATATCGCTTA 13200 

TTAACTCTAA TGTTTGTCGC TGTTGTTCTG 13260 

CTTGTGGTTT CAAAATACCT TTGCGAT CAT 13320 

ATAATTTTGC GAGTTCTCCA GTCGAATAGT 13380 

ATAGTTGATG ACCCGACGTC ACGAGCAAGT 13440 

TACTAGGCGT CTTATTTTTA TGATTTCGTA 13500 

AGTAACACAC CTACTAAACA TCTACTCTGT 13560 

TTCAACTTCA GTAATCTCTG TCGCACATTC 13620 

TGCATTGTTT TTATAACGTA TTTTATGTTC 13680 

TCTAATTTGA ATTTCAACAG GCAATACCTC 13740 
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(2) INFORMATION FOR SEQ ID NO: 55: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1059 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEONESS : double 

(D) TOPOLOGY: linear 



10 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 55: 





UuAlAAul 1 V— 




#\ J. XXwXXXXX 


Lii/Vi ± ± M- M- UAA 


TTTCATTGTT 


TCCGCCCTTT 


60 


15 


TAAAATAAAG 


TTAGTTGCTT 




Inl ILL/WVil 


XXX wV* X X 


TATATATGTT 


120 




TCAAGCTCTT 


C CG CTGT ATC 


AAATGTCTTT 


1 X LiiV— MWV» X X 


V9V»V«/WmV* X V7VJ 


CACGATATGA 


180 




CCGTGAAAGT 


AATAAGTGCC 


ATTTACTACA 


i \j*jiAx A X v* X V» 




v> x iniwtii iwv 


240 


20 


TACAGATATC 


TCTTAGATCC 


AAAGAATxTjA 


X X inwlnl X 




X*»X ^>X *J X 


300 




ATGGTCATCA 


CTCCTTTTAA 


LAA1 X Al>v»l~A 




WtlUwll XWw 


TCGTATAG CT 

X W X X «^-\J X 


360 




CTTCATTACT 


TATGCTTGCC 


TTATAGTTTT 


CAATCACATT 


GCTAACTTCT 


TTATGACTCA 


420 


25 


TTGCTTTAAC 


TTGTTCGTCT 


GTATATTTTT 


CGCAGTCTTC 


TAATTCCAGT 


TGCTCCTGTA 


480 




ATGACATCAC 


AT ATT CAACT 


TGTCTTTGGG 


TTGCCATCGT 


TAACCCTCCC 


ACAAGTCAAA 


540 




AGCTCTTTGG 


ACGTAAAACT 


TCGCCTTTGC 


TAAATCCTCA 


TGACCATTCT 


TTAACGGTGC 


600 


30 


TCTAGACATG 


TATTTGATTG 


CATTACCTAT 


TGCGAATGCT 


AGTTGAGGTG 


GATACTGTGC 


660 




CGTAACCTGT 


TCGATAAAAT 


CTATAATTTC 


AATGTCGCCG 


TATGTGTAGT 


GCGCTGGTTG 


720 


35 


CTTAACATTG 


TCTTGCGCTT 


CGTTCATATC 


TACTTTTCTG 


TTACTGATTA 


CGCTCATTAT 


780 


GCTTCACTCC 


ATTTCTTGAA 


CATTTGGTTA 


TAAGTGACAT 


CGAACCAGTA 


CGGATCACGT 


840 




gaaiSttttt 


GTGGCGTTCC 


ATCATAAAGC 


CATGGTCTTA 


ATCTTCTCTT 


TCTTTCCTGT 


900 


40 


TCATATTCCG 


CTCTCACATT 


TCGTTGGTAT 


CGGTTCAAAA 


TCGCTTTTTT 


TCTGATTTTT 


960 




TCTCTCCCTT 


TTTCTTCATC 


TTTnATtTGA 


CTCTnCATAT 


ATTCAACTTC 


TTCTGTAGAT 


1020 




iiTTGAGTCCT 


TTCTTCCACA 


CAATAATTCA 


nCGCCGCGC 






1059 



45 (2) INFORMATION FOR SEQ ID NO: 56: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3024 6 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
60 (D) TOPOLOGY: linear 
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GAAQTAAAAG AAGAATTAAA TTTAACATTA 
ATTGTAGGTC CTGCATATCC ACAACAGGAT 

S 

TTAACCAAAA TCGATTGGGA AAACGTAACT 
ATTGATAAAG ATAATGATGC GTTGATTGCG 
GGTGGTAAAC ATGACAAATA ATGACACCAT 

10 

TTCGATGTTA GAAGCTTTTC AATTAAGTOA 
GGAAAATATT ACAGCTGCAA TGTCTGATAA 

/5 CAGGCAATGT GTGGCCTTTT TTACATTACA 

TAACCAAGAT GCAGTATTTT TCAGGTCATT 
AATAGGTAAA GTGGTAATGG AAAAATTGGC 

20 TAATGAGATT GTGTTAACGG TTAATACTGA 

ACAAGGATAT CAATATATGG GAGATAGTAT 
GTTAACTATA AAATAAATTA AATTTAAAAG 

25 AATGATGAAT AAAGGTGCTT TTTGTTATAG 

GACCTAGTGA ACAATTGACA TATATCCACA 
GCGATTAATT GATAGACTCA TCATTTTTGC 

30 

CCGTAATCCA AGCCGTAATC GGAATACTGA 
AAATAAATTC TTGGGCAAAT ATTTTCGAGT 
TGAAAAACCA AATAAATAAA GCAAGTTGGC 

3S 

CAGATGTCGC TAAAATTTCT CTACCAACAC 
TAACGTTgGA TTCACTTGAT GCAATTCATA 
TATCACAGCT GCAATAACAG CAAGAATAAT 

40 

GCCAATATTC ATTGAATACA CATATGTTTC 
ATGACCGAAG TAGACCGATA AATAAATGAG 

45 G C t Gg AT AAA TGCaGCTTGT GTTTTAACAT 

CGCCAATAAT AATGCAGAAA AAGAATGTGA 
ATACAATACT AATAATTAAA ATAGCGAAAT 

60 CCTTTTTACC TCCGAAAATT ATCATCAGAA 

CATTCATTGT TTCGCCCTCC TTAATGTTTC 

55 



ACAATGGATG AAATTGAATA TGTCGGGACA 60 

ATGTTAACTG AGTTAAATGG ATTTCGCGCA 120 

ATCAATAATG AAATTACGGA TATACGCTGG 180 

CCTGCTGTCA AAGTTTGGAT TGAAACTTAT 240 

CATGTTACGA CATTATGTCC CACAAGATTA 300 

AAGTGATTTG AAGTTTGTTA AAACGCCAGA 360 

TGAAAGGTAT CCCATCGTTG TAATGGATGG 420 

TCGTGGAAAA GGGGTCGCAC CATTTAGCGA 480 

TAGTGTTGAT CAACGTTATC GTAATAGAGG 540 

GTCATTTATC ACTTCAACAT TTCAGGATAT 600 

CAATCCACAT GCCATGGCAC TTTATCGCCA 660 

GTTCGTCGGA AGACCTGTTC ATATTATGGC 720 

CATCTTTACT CATCGTCGAC CACAACAATT 780 

ATCATCGGAC AATTTACTAT AGTAAAAAGC 840 

GGTCGCTTAA CTTAAGTTAT ATTGCTAGTT 900 

GCTGT CG AG A TGGTCTTTTT ATTAAAAATG 960 

TTGCAACGGC AATACCGCCT AAAATAATAG 1020 

TTATAATATG ACCAAATGAA TATTTAAGTT 1080 

CACCAAAAAA GGCAAGGTAA ATCGTGTTCG 1140 

GCATGCCAGA TTGGAATAAT TCGTATTGCG 1200 

AATGGGTGAA CTAATGGTAA TTGTTAAATC 1260 

AGTGAACACC ATAAATTGAA CCATATCAAT 1320 

ATCTTGTTGT TCGGTTGaAA AGCCTTGTAG 1380 

TGTAATCAAC AATATTGTTG TAACGATAgT 1440 

TGTAACTATT GAGTACGAAT AAATTACAAG 1500 

CGACATAAAT CGGTACGCCA AAAATAATCA 1560 

TTAAAAATAG GGTTAAATAA GAGATGAATC 1620 

AGAGGAGCAA TAACGCCAAT ATAAATACAG 1680 

AAATATTTCC ATAAACAATA TTGTGATAGG 1740 
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CATCGAAATA GTATAAGTCA CTGTATTGGC 
TGCACCGGAT AAATATGAGA ATAATAAGAT 
5 GATGTTTCGC CCAGCAAGCG CCCATCTCCT 

TTCATGCATA CCACTAGCAA TTGTAATTGC 
TAACACTGAG GCTAGGAAGA TATCTTTCGG 

10 

TTTAATGCCT TTACCATCTG TCATATATAT 
AGTTCCGATA ATTGTACTGG CTATGGTAAT 
CAATAAAGTG AGTATTGTTG AACAGATCAT 

15 

ATTGCTATGT TGAATATGAA TGTAAATTGC 
CGATAAAATC GATTGCAGTC CGACTTTGCG 
ACCAGTGATG ATAACCGTTA AGGTATCACG 

20 

CTTGTTAGAA ATATGTAATA ATACTTTTTC 
CGATTTGACG TACTGATGAT TAATCGTOGT 

25 TTTGACTTTT AATTGATTTT TATATTTAAT 

TGTCGAAGAA ACATGTTTGA CATCTATAAT 
ATTATTGAAT GTAAATAAAA TAGCACCAAT 

30 ATTAAATGGC TTTGTAAATA AATTTCTATA 

GAATTAATAT GGTGATTATA CGCCCTTAAT 
GTAAAACGAA AATCATCATT GATAGCATCG 

35 CATTAATTGC TGAATAAGTG TTAATAATAT 

TGT^ATAGCA CATATCGTTC TTTTTAATTC 
TTTAGATTCT GGTAAATGTA TATTTTGTGA 

40 

GAGATACTGC GCAAGTGGTT GGCTACTGAT 
CAATTGTTTT TTTACAGTTT CGGCAAATGG 
CTGAATTAAT GGTGGGTGTG TCGCCATCGT 

45 

ATAGTGCTCT TCGAATAAAG GTAGCATATG 
AAGTTCCGTG AAACCAATGT CTATATTCCC 
so TTCTAATAAG CTCGGTATGA CATGTGTATC 

TAGTAACATG TGGGATACGT CACTCTCATC 



ATTTTTTAAA AAGATTAAAA ACATAGGTAG 1860 

GTTAGTCATT GTTCCCATAA TATCTTGGCC 1920 

CATTGAAATG TGTGGCGTAC GCTGTAAAAT 1980 

AACATCCATA ATAGCGCCAA GTGAACCTAT 2040 

TGGTAATGAT AAAAAGTTCA TCGTTTCATA 2100 

GATTAATTCT GTTAAACCTA TACTCAAAAA 2160 

GAGTGTACGC ATATGCCAGC CTGTAACGAG 2220 

GGCAATGGTC ATGAGTAAGA ATAAATTAAT 2280 

GATTAATATG GCAATAGAAT TCAAGATTAA 2340 

ACCAACCAAT AATACAGTTA ATAAGAACAA 2400 

CTTCTTTTCT ATAATATAAG CATCACTCGG 2460 

GTGTGTGCGA AATGCCTCAG AATCTGCTTG 2520 

CGTTTCTCCA GCAAATTGAC CATTTAATAT 2580 

ATCACGATTA TTTTGTGCAT CTTTTGTAGG 2640 

TTGACCAATT GGTTTGTTGT AAAAGTTCTC 2700 

GAATGCGATG CAGAACAAAC CTAAAATTAT 2760 

TTTCAAAAAC AAAACCCCAA TTCTATGAAT 2820 

TTTTTATTTT CAAAGATATT ACTGCTAAGT 2880 

AATTACTTAA TGGAATGTAG ACGTTTTAGT 2940 

GCCAATATCA CTCTTTGTAT AAGGCTCCTT 3000 

AGTATGATCT AATTTTATAT CTATCCATGA 3060 

TGAAATGATG TAACCTTCTT TTTGACGAAG 3120 

TGTGTATACA TCTGATTTAG TAATCTTGCG 3180 

TGCCAAGCAA TAAATATGAC TATGCTCAAA 3240 

AATTGGATCG TCTGAAGGCG CATATAAATG 3300 

TAATTGTTTG TGTTTACGTA TTTCTGGTGT 3360 

ATTTAATACG CTATTTATAA TTGTGTCATG 3420 

ATTTTGTAAA TGAAACGTTT GGATAAGTGG 3480 

ATAGCCAATG TAGATACTTT TATTTTTAGT 3 540 
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TTCATTAAAT AATAATTTCC CTTCAGATGT 
TAAAOACACA TTAAGTTCTT GTTCTAATAA 

5 

AATGTTTAGT TCAAGTGCTG TTTCGGAGAT 
TCTTAATTGT TTAATTTCCA TAGCGATATA 
ATT AT AG CAA TATTATTGAT AAATGTTCTA 

10 

ATTGAACAGA TAAATTTTTT AGATTATAGT 
TCTAAAAAAG GGGTGTGCAT CATGCACAAT 

1S CGTGAGGAAC ATGATGCGTG TGGTATTGGT 

CACGACATCA TTGATAAATC GCTTGAAATG 
GGCGCAGATG GCATCACTGG TGATGGCGCA 

2Q TTCAAACAAC ATGTAACGGA CTTTGATATC 

TTTTTTTCCA AAGAAOGCAT TTTAGGTTCT 
GAAGGCGAAG GGTTATCAAT TCTTGGTTAT 

25 GCTAAACATG TAG CAG AT AC GATGCCAGTC 

ATTGAAGATG TTGAAAAGCG TTTGTTTTTA 
CAGTGCGATT TAGAATTGTA TTTTACGAGC 

30 TGGTTACGAT CAGACCAAAT TAAAAAACTA 

TCAAAGCTAG GGTTAGTGCA TTCGAGATTT 
GCACATCCTA ACCGTATGTT AATGCATAAT 

35 

AACTGGATGC GAGCACGCCA ACATAAATTA 
AAAGTGTTTC AAATTGTCGA TGAGGATGGT 
GAGTTCTTAT CGTTAGCCAT GGAGCCAGAA 

40 

TGGTTATATA ATGAAGCGAA TGATGCAAAT 
TTAATGGAAC CGTGGGATGG TCCTACAATG 
GCGCTTACAG ATAGAAATGG ATTACGTCCA 

45 

ATTGT C TTTT CATCTGAAGT GGGTGTTGTG 
GGTCAATTGA ATCCTGGAAA GTTATTGCTT 
SO AATAATGATT TAAAAGGTGC GATTGCTGGA 

CATAAAGTTG ACTTTGATTT TGAAAATATA 



GAGCGTAATA TTGCGTCCTT GCTTTTTAAA 3660 

TGTAATTTGA CGGCTTATCG CTGATTGAGC 3720 

ATGTTCTCTT TTAGCGACCT CGATAAAATA 3780 

GGCACCTCCA AAAATGAGTG TTTTGTAACT 3 840 

TTTTTTAGAT GAATATCTTC TATTTTATAT 3900 

AATTATCATT AATAACTAAT ATCAGAATAT 3960 

GAGAAATTAA TTAAAGGCTT ATATGACTAT 4020 

TTTTATGCGA ATATGGATAA TAAAAGGTCT 4080 

TTGCGACGCT TAGATCACAG GGGCGGGGTC 4140 

GGTATTATGA CTGAAATACC TTTTGCATTT 4200 

CCAGGTGAAG GTGAATATGC CGTGGGGTTA 4260 

GAACATGAAG TAGTTTTTAA AAAATATTTT 4 320 

CGTAATGTAC CAGTTAATAA AGATGCCATT 43 80 

ATTCAACAAG TGTTTATTGA TATTAGGGAC 4440 

GCGAGAAAAC AATTAGAGTT CT ATT CG AC T 4 500 

TTATCACGCA AAACAATTGT ATATAAAGGT 4560 

TATACAGATT TATCGGATGA TTTATATCAA 4 620 

AGTACGAATA CATTCCCGAG TTGGAAAAGG 4 680 

GGTGAGATTA ACACGATTAA AGGTAATGTA 4740 

ATCGAAACAT TATTTGGCGA GGATCAACAT 4 800 

AGTGACTCTG CCATTGTAGA TAATGCGCTA 4 860 

AAGGCAGCGA TGTTACTCAT ACCTGAACCT 4 92 0 

GTACGTGCGT TTTATGAATT TTATAGTTAT 4 980 

ATTTCGTTCT GTAACGGTGA CAAACTTGGC 5040 

GGTCGTTATA CGATTACTAA AGATAACTTT 5100 

GACGTACCTG AAAGTAATGT TGCTTTTAAA 5160 

GTTGATTTTA AACAGAATAA AGTCATTGAA 5220 

GAATTACCAT ATAAAGCGTG GATTGATAAC 5280 

CAATATCAAG ATTCGCAATG GAAAGATGAG 534 0 
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CAGGAACTTG TAGAAGGTAA GAAGGATCCT 
GCAGTGTTGA ACGAGCGACC AGAATCACTA 

5 

GTTACGAATC CACCAATTGA TGCGTATCGT 
TTAGGTGGCG AAGGTAACTT ACTAGCACCT 
AAAAGGCCGG TATTGAATGA ATCACACTTA 

10 

ACTTATTTAT CAACGGTATA TGAAGGGGAT 
GAAGCAGTGA ATGCTGTAAA GCAAGGCGCT 

1S GTTGATAGCA ATGGCTTTGC AATGCCGATG 

CTTATTAAAG CAGATTTACG TATGTCTACA 
GAAGTGCATC ATGTTGCTTG TTTACTCGCA 

20 GCGCAACGTA CAGTTGAACA ACTGACATTG 

AATGTTAAGA CATATACGGA TGTATTGTCA 
GG AATTTCGA CAGTGCAAAG TTATCAAGGG 

25 CATGATGTGA TTGATCGTTA TTTTACTGGG 

GATCAAATTG ATGCTGAAAA TAAAGCACGT 
GGTAGTACAT TCCAATGGAG ACAACAAGGT 

30 

TTCTTATTGC AGCACGCATG TAAAGAAAAT 
GCGGTGAACA AAAATAGAAC AG AT CACATT 
CCGATTGACA TCGACCAAGT TGAACCGGTA 

35 ■ 

GCGATGAGTT ATGGATCGAT TTCAGCGGAA 
CAA'CTAGGTG GAAAGAGTAA TAGTGGTGAA 
CAAGTTGATG GAAGCAACAA AGTAAGTGCG 

40 

GTAACTAGTG ATTATTTACA ACATGCCAAA 
AAGCCTGGTG AAGGTGGTCA ATTACCTGGT 

4S AGAGGGTCAA CGCCAGGTAT CGGTCTGATT 

ATAGAAGATT TAGCGCAACT GATACATGAT 
GCGGTAAAAT TAGTTTCGAA AACAGGTGTT 

SO TTTGCAGATA AAATTGTCAT CAGTGGTTAC 

AGTATTCAGC ATGCCGGTGT TCCTTGGGAG 

55 



ATCGGTGCAA TGGGATATGA TGCGCCAATT 5460 

TTTAATTACT TTAAACAGCT GTTTGCACAA 5520 

GAAAAAATCG TAACGAGTGA ACTTTCTTAT 5580 

GACGAAACGG TTTTAGATCG TATTCAATTG 5640 

GCAGCGATTG ATCAGGAACA TTTTAAATTA 5700 

TTGGAAGATG CGTTAGAAGC ATTAGGCCGA 5760 

CAAATTCTAG TGTTAGATGA TAGTGGATTA 5820 

TTACTCGCAA TAAGTCATGT GCATCAATTA 5880 

AGTTTAGTCG CTAAATCTGG TGAGACACGA 5940 

TATGGCGCGA ATGCAATTGT GCCATACCTA 6000 

ACAGAAGGGT TACAAGGCAC CGTTGTCGAT 6060 

GAAGGTGTCA TTAAAGTAAT GGCTAAGATG 6120 

G CACAAAT AT TTGAAGCGAT TGGCTTGTCT 6180 

ACACAGTCTA AGTTATCTGG TATTTCGATT 6240 

CAACAAAGTG ATGATAATTA TCTTGCATCA 63 00 

CAACATCATG CTTTTAATCC GGAATCTATT 63 60 

GACTATGCGC AATTTAAAGC ATACTCTGAA 6420 

AGACATTTAC TTGAATTTAA AGCATGTACA 6480 

AGTGACATTG TCAAACGCTT TAATACAGGG 6540 

GCACATGAAA CGTTAGCACA AGCCATGAAC 6600 

GGTGGCGAAG ATGCAAAACG TTATGAAGTA 6660 

ATTAAACAAG TTGCTTCTGG GCGTTTTGGT 6720 

GAAATTCAAA TTAAAGTTGC GCAAGGTGCA 6780 

ACTAAGGTAT ATCCGTGGAT TGCGAAGACA 6840 

TCACCACCGC CACATCATGA TATTTATTCA 6900 

TTGAAAAATG CGAATAAAGA TGCAGATATC 6960 

GGTACCATTG CATCTGGGGT GGCAAAAGCA 7020 

GATGGTGGTA CAGGGGCTTC ACCCAAAACG 7080 

ATTGGTTTAG CAGAAACACA TCAAACATTA 7140 
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AAAGATGTAG 


CGTACGCATG 


TGCGCTTGGA 


GCGGAAGAAT 


TTGGATTTGC 


AACTGCACCA 


7260 




TTAGTGGTGT 


TGGGCTGTAT 


TATGATGCGT 


GTATGCCATA 


AAGATACATG 


TCCAGTAGGA 


7320 


5 


GTTGCAACTC 


AAAACAAAGA 


TTTACGTGCT 


TTATATAGAG 


GTAAAGCACA 


TCATGTTGTT 


7380 




AATTTTATGC 


ATTTTATTGC 


ACAAGAATTA 


AGAGAAATTT 


TAGCATCTTT 


AGGTTTGAAA 


7440 


10 


CGTGTAGAAG 


ACTTAGTTGG 


AAGAACTGAT 


TTATTACAAC 


GATCATCAAC 


ATTAAAAGCG 


7500 


AATAGCAAAG 


CGGCTAGTAT 


TGATGTTGAA 


AAACTGTTAT 


GTCCTTTCGA 


TGGGCCAAAC 


7560 




ACAAAAGAAA 


TTCAACAAAA 


TCATAATCTT 


GAGCATGGAT 


TTGATTTAAC 


AAATTTATAT 


7620 


15 


GAAGTAACGA 


AGCCATATAT 


TGCTGAAGGG 


CQTCGCTATA 


CAGGTAGCTT 


TACAGTAAAT 


7680 


AATGAACAAC 


GTGATGTAGG 


GGTTATTACA 


GGTAGTGAGA 


TTTCGAAACA 


ATATGGAGAA 


7740 




GCAGGACTTC 


CTGAAAATAC 


AATTAATGTT 


TATACGAATG 


GTCATGCTGG 


TCAAAGTCTT 


7800 


*n 

i£U 


GCAGCATATG 


CACCGAAAGG 


CTTAATGATT 


CATCATACTG 


GAGATGCGAA 


TGACTATGTT 


7860 




GGTAAAGGAT 


TATCTGGTGG 


TACGGTCATT 


GTCAAAGCAC 


CTTTTGAAGA 


ACGACAAAAT 


7920 




GAAATTATTG 


CTGGTAACGT 


CTCATTCTAT 


GGTGCGACAA 


GTGGTAAGGC 


ATTTATTAAC 


7980 


25 


GGTAGTGCAG 


GAGAAAGATT 


CTGTATTAGA 


AATAGTGGTG 


TAGATGTTGT 


CGTTGAAGGT 


8040 




ATCGGCGACC 


ATGGATTAGA 


GTATATGACT 


GGTGGACATG 


TCATTAATTT 


AGGTGATGTA 


8100 




GGTAAGAACT 


TCGGTCAAGG 


TATGAGTGGT 


GGTATTGCTT 


ACGTTATCCC 


GTCTGATGTA 


8160 


30 


GAAGCTTTTG 


TTGAAAATAA 


TCAACTAGAT 


ACGCTTTCGT 


TTACAAAGAT 


TAAACACCAA 


8220 




GAAGAAAAAG 


CATTCATTAA 


GCAAATGCTG 


GAAGAACATO 


TGTCACACAC 


GAATAGTACG 


8280 




AGAGCGATTC 


ATGTGTTAAA 


ACATTTTGAT 


CGCATTGAAG 


ATGTCGTCGT 


TAAAGTTATT 


8340 


35 


CCTAAAGATT 


ATCAATTAAT 


GATGCAAAAA 


ATTCATTTGC 


ACAAATCATT 


ACATGACAAT 


8400 




GAAGATGAAG 


CGATGTTAGC 


TGCATTTTAC 


GATGACAGTA 


AAACAATCGA 


TGCTAAACAT 


8460 




AAACCAGCCG 


TTGTGTATTA 


AGGAAAGGGG 


GAGATACGAT 


GGGTGAATTT 


AAAGGATTTA 


8520 


40 


TGAAGTATGA 


CAAACAGTAC 


TTAGGTGAAT 


TATCACTGGT 


AGAC CGTTTG 


AAGCATCATA 


8580 




AAGCATATCA 


ACAACGATTT 


ACTAAAGAAG 


ATGCCTCTAT 


CCAAGGTGCA 


CGATGTATGG 


8640 


45 


ATTGTGGAAC 


GCCGTTTTGT 


CAAACCGGAC 


AACAGTATGG 


TAGGGAAACA 


ATAGGTTGTC 


8700 


CAATTGGAAA 


CTACATTCCT 


GAATGGAACG 


ACTTAGTGTA 


TCATCAAGAT 


TTTAAAACTG 


8760 




CTTATGAACG 


CTTAAGCGAA 


ACAAATAACT 


TTCCTGACTT 


TACAGGGCGT 


GTATGTCCTG 


8820 


60 


CACCATGCGA 


AAGTGCTTGT 


GTGATGAAGA 


TTAATAGAGA 


ATCGATTGCG 


ATTAAAGGTA 


8880 




TTGAACGCAC 


AATTATTGAT 


GAAGCTTTTG 


AAAATGGTTG 


GGTAGCGCCG 


AAAGTTCCGA 


8940 
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15 



20 



25 



35 



45 



60 



CTGAAGAACT 
GCGGTTTATT 
GTATTAAGTT 
ATATTGATAA 
AAAAAGGTAG 
ATTATTTAAC 
CAAAAGATAA 
CAGCATTAAG 
AAGCAATTAC 
ACTATGCGCA 
AAACAATGCG 
TAGAGCAAGG 
ACCTTGTATT 
ACATTAAAAC 
AAAAGGTATT 
AAGAAGGTAG 
AATCTTTGTA 
AAATCTAGTA 
GACAACAAAT 
GTGGAAGACA 
AACGTTCATA 
CGGTCTTGAA 
CCATCAATAT 
TTACCTTTTT 
TTGAGATTGG 
GTGAAATATG 
ATTTAGGAGT 
AATAACGCAA 
TGAAATGGCT 



TAATCTACTA 
AATGTATGGT 
AATGGAAGAA 
AGCAACGTTA 
AGATTTACCT 
TGAACAAACG 
GAATGTCATT 
AGAAAATTGT 
ATTTACAGAA 
CCAAGAGTAC 
TTACGATGTT 
CGAAAATGGT 
ATTATCAATC 
GGATAGAAAT 
TGCTGCTGGA 
AGGCGTAGCG 
TGGAAATGGT 
TCTATCAACG 
AGATTAATTA 
ATGATTTGTG 
TATGATAAAT 
AACCGACAGG 
TTATATTAAA 
TATTTGTCTT 
AAGGGCATTT 
ATGGATGGCT 
TGGCCATGCA 
TTGTAGCGAG 
ACCCCAGATA 



GGATATCAAG 
ATTCCGAATA 
GCGGGCATTA 
GAATCTGAGT 
TTAGAAGGAC 
CAGTTGTTAA 
ATCATTGGTG 
AAATCGATTG 
AATGCATCAT 
GAAGCTAAGT 
GACGATAAAG 
ATGGTCATGA 
GGCTTCGAAG 
OGAATCGTGG 
GATGCTAGAC 
AAAG CAGTAG 
GGTTACGTTG 
TCACATGCCA 
TAAGTAGTGA 
GTAATCATGT 
ATTGTGTTTA 
GGCTTAACGG 
TTCTATATAT 
TGAATGGCTC 
GGCTTGTGCA 
TGTGTGGACA 
TCTACACTTT 
GAGTTATTGC 
ATTGTGACAA 



TAACTATTTA 
TGAAACTTGA 
CTTTCATTAA 
ATGATGCCAT 
GCATGGGTOA 
ATGGAGAAAT 
CTGGTGATAC 
TTCAATTTAA 
GGCCTTTAGC 
TTGGTAAGGA 
GACACATACG 
AAGAAGGACC 
GTACAGAACC 
CGGATGATAC 
GTGGTCAAAG 
ATCAGTATTT 
ACGTTGTGAC 
TCTTTGTAAC 
TTTTTTACAT 
AATGCTTAAA 
GGAGGAATAC 
CTCGCGGGGG 
AATGAAGGTA 
GTAATTTTTG 
ATATACATAG 
AGTTTGCTAT 
ATAATGGTGA 
TACATATGTC 
AATAAAAATA 



TGAACGTGCT 
TAAAGATGTG 
TGGTGTTGAA 
TATATTATGT 
TGGTATACAT 
TGATGATATA 
AGGGGCAGAC 
TAAATATACG 
AATGCCGGTG 
ACCACGTGCA 
TGGTTTGTAT 
TGAAAGATTT 
AACAGTACCG 
AAACTATCAA 
TTTAGTTGTA 
AGCTAGTAAA 
ATGCTGAATC 
CTAAAAACAA 
TCGTTTATAG 
AACAATATTG 
CCAAGTCCGG 
TTCGAATCCC 
AGTGCTCAAA 
ATAATAGAAA 
CTAAATGTCT 
TTATAGATAT 
GAGCGTGGTG 
GTTATGGCTC 
TTTTGTTGAA 



AGAGAATCAG 
GTTCGACGTC 
GTCGGTGTTG 
ACTGGTGCAC 
TTCGCTATGG 
ACAATAACTG 
TGTGTAG CGA 
AAATTGCCAG 
TTTAAAATGG 
TATGGTGTTC 
ACTCAAATTT 
TGGCCTGCTG 
AATGCTTTTA 
ACTAATAATG 
TGGGCAATTA 
GTTTGTGTAT 
GAGTTTGAAA 
AGGTTTGTAA 
GTCAACTGTA 
ACTTTTACAG 
CTGAAGGGAT 
TCTTCCTCCG 
TTTTGAGTAT 
TGATAAGGCA 
TTTTTGTTTT 
GCATTTTTCA 
AGGTATTGTT 
ATTGATTTTC 
AGCCTTTACA 



9060 
9120 
9180 
9240 
9300 
9360 
9420 
9480 
9540 
9600 
9660 
9720 
9780 
9840 
9900 
9960 
10020 
10080 
10140 
10200 
10260 
10320 
10380 
10440 
10500 
10560 
10620 
10680 
10740 
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TAAAAAGAGA AGATGTAAAA GCCATCGTAA CCGCTATTGG GGGAAAAGAA AATCTTGAAG 10860 

CTGCAACGCA TTOTGTAACA CGATTACGTT TAGTGCTGAA GGATGAAAGT AAAGTTGATA 10920 

6 AAGACGCATT AAGTAATAAC GCGTTGGTCA AGGGGCAGTT TAAAGCAGAC CATCAATATC 10980 

AAATTGTCAT TGGTCCAGGA ACAGTCGATG AAGTGTATAA GCAGTTTATT GATGAAACAG 11040 

GTGCTCAAGA AGCTTCGAAA GATGAAGCGA AACAAGCAGC TGCACAAAAA GGGAATCCAG 11100 

10 TACAACGTTT GATCAAATTG TtGGGGGATA TTTTTATACC AATATTACCT GCGATTGTGA 11160 

CAGCTGGTTT GTTAATGGGA ATCAATAATT TACTTACAAT GAAAGGTTTA TTTGGTCCAA 11220 

AAGCACTTAT TGAGATGTAT CCACAAATTG CTGATATTTC AAACATCATT AATGTGATTG 11280 

15 

CGAGTACGGC ATTTATTTTC TTACCAGCAT TAATTGGTTG GAGTAGTATG CGTGTATTTG 11340 

GTGGTAGTCC GATTCTAGGC ATAGTCTTAG GTTTGATTTT AATGCATCCG CAATTAGTAT 11400 

CTCAGTATGA TTTGGCAAAA GGGAATATTC CGACGTGGAA CTTATTTGGC TTAGAGATTA 11460 

20 

AGCAGTTGAA TTACCAAGGT CAAGTGTTGC CAGTtTTAAT TGCAGCTTAC GTTCTAGCTA 11520 

AAATTGAAAA AGGATTAAAT AAAGTCGTTC ACGATTCGAT AAAAATGTTG GTCGTTGGAC 11580 

CCGTAGCGCT TTTAGTTACT GGATTTTTAG CATTTATTAT CATTGGACCA GTTG CGTT AT 1164 0 

25 

TGaTTGGTAC AGGTATTACA TCTGGTGTTA CATTTATATT CCAACATGCA GGATGGCTTG 11700 

GCGGAGCAAT ATATGGATTG TTATATGCAC CACTTGTAAT TACAGGACTA CAC CAT ATG T 11760 

30 TTTTAGCAGT AGATTTCCAA TTGATGGGTA GCAGCTTAGG CGGTACGTAT TTATGGCCAA 1182 0 

TTGTTGCGAT TTCCAATATT TGTCAGGGCT CTGCAGCATT TGGAGCATGG TTTGT CT AT A 118 80 

AACGTCGTAA AATGGTTAAA GAAGAAGGCT TGGCATTAAC ATCTTGTATT TCTGGTATGT 11940 

35 TAGGTGTTAC TGAACCAGCC ATGTTCGGTG TGAACTTACC TCTGAAATAT . CCATTTATCG 12000 

CTGCGATATC AACGTCTTGT GTATTGGGGG CAATCGTTGG TATGAATAAC GTACTTGGAA 12 060 

AAGTTGGTGT TGGTGGCGTG CCAGCATTCA TTTCAATTCA AAAAGAATTT TGGCCAGTAT 1212 0 

40 ATCTTATTGT GACAGCTATT GCTATTGTTG TACCATGTAT ACTAACAATT GTGATGTCTC 12180 

ATTTTAGTAA ACAAAAAGCG AAAGAAATTG TTGAAGATTA ATAAAATAAA AAAGGGGCGT 12240 

TCGTTATTTG GACGTCCTTT ATTACGTTAT AAGGTGGTAA TTGTGTGTCG AAAGAAATAG 12300 

45 ATTGGAGAAA ATCCGTTGTA TATCAAATTT ATCCTAAGTC GTTTAATGAT ACGACGGGGA 123 60 

ATGGTATAGG AGATATCAAT GGAATTATAG AAAAATTGGA TTATATCAAG TTATTGGGTG 12420 

TTGATTATAT TTGGTTAACA CCAGTGTATG AATCACCGAT GAATGATAAT GG CT ATG AT A 124 80 

60 

TCAGCAATTA TTTAGAAATC aATGAAGACT TTGGAACGAT GGATGATTTT GaAAAGTTAA 12540 
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CGACGGAGCA TGaATGGTTT AAAGAAGCCC 
ATTACTTTTT CAGATCATCT GAAGACGGGC 

5 GTAATGCATG GAAGTATGAT TCTGAGACAG 

GTCAAGCTGA TTTAAATTGG GATAATCCGG 
ATCATTGGAT AGACTTCGGC GTTGATGGTT 

10 AAGGTGAATT TAAGGACTCT GACAAAATAG 

TGCATGAGTT TCTGCATGAA TTAAATCGTC 

TAGGAGAAAT GTCTTOGACG ACGATTGAAA 

15 

AAGAATTGAA TAGTGTTTTT AATTTTCATC 

AGTGGACAAA TGCGAgcTTG nATTTTCATA 

GAGGTATTTA TGACGGTGGC GGATGGAACG 

20 

GGGTAGTGTC TAGATTTGGT GATOATACGT 
TGTTAGCTAT CGCACTGCAT ATGTTGCAAG 

25 TTGGTATGAC GGACCCACAT TTTACATCAA 

ATGCCTACCA TCAGTTGTTA AGTGAAGGGC 
GACAOAAGTC ACGAGACAAT TCGAGAACGC 

30 GATTTACAGC TGGTAAnCCT TGGATTGATA 

GACAAGCACT TCAGAATAAA GAGTCTATTT 
GACATACGCA TGATATTATT ACGTATGGAG 

35 ATTTATTTGT TTATGAACGT CATTATAAGA 

CAGCATCGGC TGTTGATTTG ccagaaggat 
CAGGCACAGT GGAAAATAAT ACGATAAGCG 

40 CGTAAAATAA ATTGAGTGGA TGCGTTTATA 

ATGAGGCGTT GAAAGAAGAT ATATTAAACG 
CTGAACATGA TTTGGTGCAA TTGTACCAGT 

45 

ATTTGTTGGC ATTAGACGGC ATGATTCAAA 
ATCAGGAGGT TACAGAGTTT CCATTTTCTG 
AAATGGGCGT CGCATATTTA ACTGAAGTTG 

50 

TTCCAGAAGT TCAACATGCT TTAAACATCA 



GTAAATCTAA AGATAACCCy TATAGAGATT 12660 

CGCCAACAAA TTGGCATTCT AAATTCGGTG 12720 

ATGAATATTA TTTACATTTA TTTGATGTCA 12780 

AAGTACGTCA ATCGTTATAT CGCATAGTCA 12640 

TTCGATTTGA TGTCATTAAC TTAATTTCTA 12900 

GTAAAGAATT TTATACGGAT GGTCCTAGAG 12960 

AAACGTTTGG TAACACTGAC ATGATGACTA 13020 

ATTGTATTAA GTATACACAA CCAGAACGCC 13080 

ATCTAAAGGT TGATTATGTT GATGGTGAAA 13140 

AGTTAAAGGA AATTCTGATG CAATGGCAAC 13200 

CGATTTTCTG GTGTAATCAT GATCAGC CAC 13260 

CGGAAGAGAT GAGGATACAA AGTGCTAAAA 13320 

GGACGCCATA TATTTACCAA GGTGAAGAAA 13380 

TAGCACAATA TCGTGATGTT GAATCGATTA 13440 

ATGCTGAAGC GGATGTGTTA GCGATTTTAG 13500 

CTATGCAATG GAGTGATGAT GTTAATGCTG 13 560 

TTTCGGAAAA TTATCATCAG GTCAACGTTA 13 620 

TCTATACGTA TCAAAAATTA ATACAATTAA 13 680 

ACATTGTGCC ACGTTTTATG GATCATGATC 13740 

ATCAACAATG GCTAGTAATT GCGAATTTCT 13 800 

TGGCTAGAGA AGGTTGTGTT GTGATTCAAA 13 860 

GGTTTGGTGC AATTGTAATC GAAACAAACG 13 920 

TGGCGAAACA AAAAAAGTTT ATGAAGATTT 13 980 

GGCAGATTCA ATATGGTGAA CAAATTCCGT 14040 

CATCTCGAGA GACCGTGCGT AAGGCATTAG 14100 

AGATTCATGG TAAAGGGTCA CTTGTCATTT 14160 

AACTTGTTAG TTTTAAAGAA ATGCAAGAAG 14220 

TTGTGAATGA GGTTGTTGAA GCGCATGAAG 14280 

ATTCTAGTGA ATCACTCATT CATATTGTTA 14340 
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is 



20 



25 



30 



SO 



TTGTTTCAGA 


TATAGGTAAT 


GATGTTGCGA 


GTGATTCTAT 


TTATGATTAT 


TTGGAAAAGG 


14460 


TATTAAATCT 


TAATATTAGT 


TATTCAAGTA 


AGTCTATTAC 


TTTTGAACCG 


TTTGATGAAC 


14520 


AAGCATATCA 


ATTGTTTGGT 


GATGTATCGG 


TGGCTTATTC 


AGCAACAGTT 


CGAAGTATTG 


14580 


TGTATTTAGA AAATACAATG 


CCGTTTCAAT 


ATAATATTTC 


AAAACATCTT 


GCAAATGAAT 


14640 


TTAAATTTAA 


TGACTTCTCA 


AGACGTCGTA 


TAAAGTAAAC 


AATGATATAA 


ATGATTTATA 


14700 


CTTGCAATTA 


ACTATTAAAA 


TATAGTAATA 


TATATCTTGC 


CGTGCTAGGT 


GGGGAGGTAG 


14760 


CGGTTCCCTG 


TACTCGAAAT 


COGCTTTATG 


CGAGGCTTAA 


TTCCTTTGTT 


GAGGCCGTAT 


14820 


TTTTGCGAAO 


TCTGCCCAAA 


GCACGTAGTG 


TTTGAAGATT 


TCGGTCCTAT 


GCAATATGAA 


14880 


CCCATOAACC 


ATGTCAGGTC 


CTGACGGAAG 


CAGCATTAAG 


TGGATCATCA 


TATGTGCCGT 


14940 


AGGgTAGCCG AGATTTAGCT 


AACGACTTTG 


GTTACGTTOG 


TGAATTACGT 


TCGATGCTTA 


15000 


GGTGCACOGT 


TTTTTATTTT 


TTAAATATTA 


AACCGATTAT 


TAAGAGTTGA 


AAATATATAA 


15060 


TTATAGAAGC 


TACTTTCTTG 


AAGACAATTC 


AGCGTATTAT 


ACGTGGAACA 


TGTTTGTGGG 


15120 


AAGTAGCTTT 


TTTATATGTG 


AAGTTTGATT 


CAAGTGAACT 


CGATGTGCAG 


TTTGAATGAT 


15160 


TTTTGTGTCA 


ATGAAAAGTA 


AGAAGTTATA 


ATTTGATGAT 


AAAGAAATGA 


TGGTGAAATG 


1S240 


AGGGGGAGTA 


TCTTACAATA 


GAATTATTAA 


TGAGATACGT 


TATGATTATT 


GACAATCAAA 


15300 


TGCCTACGGA 


GGACATATGC 


AAATATATTT 


AAGTACTTTA 


ACAGAGTTAG 


ATTATGATAA 


15360 


ATCTTTAAAT 


AGTATTGAAG 


AAAGTTTTGA 


TGATAATCCT 


GAAACGAGTT 


GGCAAGCACG 


15420 


TGCGAAAGTA 


AAACATTTAA 


GAAAATCTCC 


TTGCTATAAT 


TTTGAATTAG 


AAGTAATAGC 


15480 


GAAAAATGAA 


AATAACGATG 


TCGTTGGACA 


CGTTTTATTA 


ATTGAAGTAG 


AAATTAATAG 


15540 


TGATGATAAG 


ACGTATTATG 


GTTTGGCGAT 


TGCCTCTTTA 


TCAGTTCATC 


CTGAATTACG 


15600 


TGGACAAAAA 


TTAGGTCGTG 


GCTTGGTTCA 


AGCAGTAGAA 


GAGCGTGCCA 


AAGCACAAGA 


15660 


GTATAGTACG 


GTTGTTGTAG 


ACCATTGTTT 


TGACTACTTT 


GAAAAGTTGG 


GTTATCAAAA 


15720 


TGCTGCTGAG 


CATGACATTA 


AATTAGAATC 


TGGTGATGCA 


CCGTTACTTG 


TAAAATATTT 


15780 


ATGGGATAAT 


TTGACGGATG 


CACCACACGG 


AATCGTAAAA 


TTTCCAGAAC 


ATTTTTATTA 


15840 


ATTGTTCAAT 


TAAGAAGTAA 


AGGTATTATC 


ATGCTATAAT 


GAGAGGTAAT 


TGTTTATGGA 


15900 


GGTGCTAACT 


TGAATTATCA 


AGCCTTATAT 


CGTATGTACA 


GACCCCAAAG 


TTTCGAGGAT 


15960 


GTCGTCGGAC 


AAGAACATGT 


CACGAAGACA 


TTGCGCAATG 


CGATTTCGAA 


AGAAAAACAG 


16020 


TCGCATGCTT 


ATATTTTTAG 


TGGTC CGAGA 


GGTACGGGGA 


AAACGAGTAT 


TGCCAAAGTG 


16080 


TTTGcTAAAG 


CAATCAACTG 


TCTAAATAGC 


ACTGATGGAG 


AACCTTGTAA 


TGAATGTCAT 


16140 
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AATAATGGCG TTGATGAAAT AAGAAATATT 
TCGAAATATA aagtttatat tatagatgag 

5 GCCCTTTTAA AGACGTTAGA AGAACCTCCA 

GAACCACATA AAATCCCTCC AACAATCATT 
ATTAGCCTAG ATCAAATTGT TGAACGTTTA 

10 

TGTGAAGATG AAGCCTTGGC ATTTAtcgCT 
TTAAGTATTA TGGATCAGGC TATTGCATTT 
TTGAATGTCA CAGGTAGCGT ACATGATGAA 

IS 

CAAGGTGACG TACAAGCATC TTTTAAAAAA 
GTGAATCGCC TAATAAATGa TATGATTTAT 
TCTGAGAAAG ATACTGAGTA TCGAGCACTG 

20 

ATGATTGATC TTATTAATGA TACATTAGTG 
CATTTTGAAG TGTTGTTAGT AAAATTAGCT 

25 GCGAATGTAG CTGAACCAGC ACAAATTGCT 

CGTATGGAAC AGTTAGAGCA AGAACTAAAA 
CCTGTTCAAA AATCTTCGAA AAAGCCTGCG 

30 TCAATGCAAC AAATTGCAAA AGTGCTAGAT 

AAAGATCATT GGCAAGAAGT GATTGATCAT 
A G TTTATTGC AAAATTCGGA ACCTGTGGCG 

55 GAGGAAGAGA TCCATTGTGA AATCGTCAAT 

AGTCTTGTAT GTAATATCGT TAATAAAAAC 
TGGCAAAGAG TTCGAACGGA ATATTTACAA 

40 AAGCAACAAG CACAACAAAC AGATATTGCT 

ACTGTACATG TGATAGATGA AGAGTGATAC 
AAAGAAACAT CATTTTATTG ATAAATATTT 

45 

GCGGTGGCGG AAACATGCAA CAAATGATGA 
CTCAAGAACA AGAAAAACTT AAAGAAGAGC 
TTGCAGTTAC TGTAACTGGT CATAAAGAAG 

SO 

TAGACCCAGA CGATATTGAA ATGCTACAAG 



AGAGACAAAG TTAAATATGC ACCAAGTGAA 16260 

GTGCACATGC TAACAACAGG TGCTTTTAAT 16320 

GCACACGCTA TTTTTATATT GGCAACGACA 16380 

TCTAGGGCAC AACGTTTTGA TTTTAAAGCA 1S440 

AAATTTGTAG CAGATGCACA ACAAATTGAA 16500 

AAAGCGTCTG AAGGGGGTAT GCGTGATGCA 16560 

GGTGATGGTA CGTTAACATT GCAAGATGCG 16620 

GCGTTGGATC ACTTGTTTGA TGATATTGTA 16680 

TACCATCAGT TTATAACAGA AGGTAAAGAA 16740 

TTTGTCaGAG ATACGATTAT GAATAAAACA 16800 

ATGAACTTAG AATTAGATAT GTTATATCAA 16860 

TCGATTCGTT TTAGTGTGAA TCAAAACGTT 16920 

GAGCAGATTA AGGGTCAACC ACAAGTGATT 16980 

TCATCGC CAA ACACAGATGT ATTGTTGCAA 17040 

ACACTAAAAG CACAAGGAGT GAGTGTCGCT 17100 

AGAGGCATAC AAAAATCTAA AAATGCATTT 17160 

AAAGCGAATA AGGCAGATAT CAAATTGTTG 17220 

GCCAAAAATA ATGATAAAAA ATCACTCGTT 17280 

GCAAGTGAAG ATCACGTACT TGTGAAATTT 17340 

AAAGACGACG AGAAACGTAG TAGTATAGAA 17400 

GTTAAAGTTG TTGGTGTACC ATCAGATCAA 17460 

AATCGTAAAA ACGAAGGCGA TGATATGCCA 17520 

CAAAAAGCAA AAGATCTTTT CGGTGAAGAA 17580 

ATGACAAGCG ATATAATCGT ATGTATAATG 17640 

ATTGATTTTC AAGGAGGAAA TGGAATATGC 17700 

AACAAATGCA AAAAATGCAA AAGAAAATGG 17760 

GTATTGTAGG AACAGCTGGC GGTGGCATGG 17820 

TTGTCGACGT TGAAATCAAA GAAGAAGCTG 17880 

ACTTAGTGTT AGCAGCTACT AATGAAGCGA 17940 
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TCCCTGGaAT GTGATCATAG ATGCATTATC 
TTATGAAATT GCCAGGCATT GGTCCAAAGA 

5 ATATGAAAGA AGACGATGTT GTTCAGTTTG 

TAACATATTG TAGCGTATGT GGTCACATTA 
ATAAGCAAAG AGATCGTTCA GTTATTTGTG 

10 TGGAAAAAAT GAGAGAATAC AAAGGTTTAT 

TGGATGGCAT TGGACCAGAA GATATTAATA 
ATGAAGTTAG CGAATTAATC TTAGCTATGA 

TS 

TGTATATTTC TAGATTAGTT AAGCCTATAG 
TATCGGTAGG TGGCGATTTA GAGTATGCTG 
GTAGAACAGA AATGTAATkT CTTCTATTAA 

20 

AAGTCACAGT GTAATCATTG TGGCTTTTTT 
GCGGTGTGGC GGTGGTATGG TTTACCTAGT 
CAAGCCGTTG GTTGTGATTT GTTACTTCTA 

25 

TAGATCTATG GTTATGGTGT GTTGGTGCTA 
CAAATGAAAT TCTTTTGTAA TTGAAATGAT 
GGTCTAAAGC TTATTAAATC AGCCTGTATA 

30 

TAAATTTATT TTTAATTTCT GGTAAAAAAA 
ATATGGTTAG AGAAAAATCT GTTTCTTGTT 

35 TTTTTAAGTT CGATTTTTAG G AT AAGGGCG 

ACTG'JTGTTA AGCAGTTTGA AAGCCTGTAT 
CTCAACTTAA GAAATAACTT GAATTACTAA 

40 AAATGTTAAT AAAATGTATA ATTAATTCTT 

AATGACAATA TGTCAAOGTT AATTCCAAAA 
GTATTTATGA GCTAATCAAA CATCATAATT 

45 GAACGCTGGC GGCGTGCCTA ATACATGCAA 
CTGATGTTAG CGGCGGACGG GTGAGTAACA 
ACTTCGGGAA ACCGkAGCTA ATAC CGGATA 

50 

AGACGGTCTT GCTGTCACTT ATAGATGGAT 



CAOAACCTAT ATCAAAACTT ATTGATAGCT 18060 

CAGCCCAACG TCTGGCTTTT CATACCTTAG 18120 

CCAAAGCATT AGTAGATGTT AAGAGAGAAT 19180 

CTGAAAATGA TCCATGTTAT ATTTGTGAAG 18240 

TTGTGGAAGA TGACAAAGAT GTCATAGCTA 18300 

ATCACGTTTT ACATGGGTCT ATTTCGCCTA 18360 

TTC CTTCATT GATTGAACGC TTGAAAAACG 18420 

ACCCGAACTT AGAGGGGGAA TCTACAGCCA 18480 

GTATCAAAGT GACGAGATTA GCACAAGGGT 18540 

AOGAAGTAAC ATTATCTAAA GCAATCGCAG 18600 

ACATTTTTGA TTTTAATACT ATAGTAAGAA 18660 

TATGGTGTGG TGTGATGTAC TACTTTATTT 18720 

TTTACTGAGG GATGGGTAAT CTTTAGGAAG 18780 

ATAGTAATGA TGTGAATTGG ATTATCGAAT 18840 

TTAATTTGAT AAATGCGGTT AATGACTATG 18900 

AGATGCTGGC TTAGTAAGTT GTACTTCTTT 18960 

GCGGTGTTTT GAGAGATTAT TTAAAACTTG 19020 

TAACGTT CTG TTTTGCGTTT TTTTTGATTG 19080 

CTAAAAAACG TACTATTTAT AAGTGGGGAT 1914 0 

TTCAGTACAG ATGACAAAGG TGTAATTTTT 19200 

AGTATTTATT TGTTGAGGCA AACAAAACAA 19260 

CGAAAATTAA TTTTAAAAAG TTATTGACTT 19320 

GTCGGTAAGA AAAATGAACA TTGAAAACTG 19380 

AACGTAACTA TAAGTTACAA ACATTATTTA 19440 

TTTATGGAGA GTTTGATCCT GGCTCAGGAT 19500 

GTCGAGCGAA CGGACGAGAA GCTTGCTTCT 19560 

CGTGGATAAC CTACCTATAA GACTGGGATA 19620 

ATATTTTGAA CCGCATGGTT CAAAAGTGAA 19680 

CCGCGCTGCA TTAGCTAGTT GGTAAGGTAA 19740 
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10 



15 



20 



25 



30 



35 



40 



GAGACACGGT 
gCtGaCGGAG 
GGGAAGAACA 
GGCTAACTAC 
TGGGCGTAAA 
GTGGAGGGTC 
GTAGCGGTGA 
TGTAACTGAC 
CCACGCCGTA 
AACGCATTAA 
GGGGACCCGC 
CAAATCTTGA 
GACAGGTGGT 
CGAGCGCAAC 
GTGACAAACC 
TACACACGTG 
CATAAAGTTG 
CTAGTAATCG 
CGTCACACCA 
OGTCGAAGGT 
GCGQCTGGAT 
ATAACGTGAC 
TAAAGTGATA 
TACATTGAAA 
AAAGAGTTTT 
CACAAGATTA 
TGACTTATAA 
. GGCACTAGAA 
AGCTTTGATC 



CCAGACTCCT 
CAACGCCGCG 
TATGTGTAAG 
GTGCCAGCAG 
GCGCGCGTAG 
ATTGGAAACT 
AATGCGCAGA 
GCTGATGTGC 
AACGATGAGT 
GCACTCCGCC 
ACAAGCGGTG 
CATCCTTTGA 
GCATGGTTGT 
CCTTAAGCTT 
GGAGGAAGGT 
CTACAATGGA 
TTCTCAGTTC 
TAGATCAGCA 
CGAGAGTTTG 
GGGACAAATG 
CACCTCCTTT 
ATATTGTATT 
TTGCTTATGA 
ACTAGATAAG 
AAATAAGCTT 
ATAACGCGTT 
AAATGGTGGA 
GCCGATGAAG 
CAGAGATTTC 



ACGGGAGGCA 
TGAGTGATGA 
TAACTGTGCA 
CCGCGGTAAT 
GCGGTTTTTT 
GGAAAACTTG 
GATATGGAGG 
GAAAgCGTGG 
GCTAAGTGTT 
TGGGGAGTAC 
GAGCATGTGG 
CAACTCTAGA 
CGTCAGCTCG 
AGTTGCCATC 
GGGGATGACG 
CAATACAAAG 
GGATTGTAGT 
TGCTACGGTG 
TAACACCCGA 
ATTGGGGTGA 
CTAAGGATAT 
CAGTTTTGAA 
AAATAAAGCA 
TAAGTAAAAT 
GAATTCATAA 
TAAATCTTTT 
AACATAGATT 
GACGTTACTA 
CGAATGGGGA 



GCAGTAGGGA 
AGGTCTTCGG 
CATCTTGACG 
ACGTAGGTGG 
AAGTCTGATG 
AGTGCAGAAG 
AACACCAGTG 
GGATCAAACA 
AGGGGGTTTC 
GACCGCAAGt 
TTTAATTCGA 
GATAGAGCCT 
TGTCGTGAGA 
ATTAAGTTGG 
TCAAATCATC 
GGCAGCGAAA 
CTGCAACTCG 
AATACGTTCC 
AGCCGGTGGA 
AGTCGTAACA 
ATTCGGAACA 
TGTTTATTTA 
GTATGCGAGC 
ATAGATTTTA 
GAAATAATCG 
TATAAAAGAA 
AAGTTATTAA 
ACGACGATAT 
AACCCAGCAT 



ATCTTCCGCA 
ATCGTAAAAC 
GTACCTAATC 
CAAGCGTTAT 
TGAAAGCCCA 
AGGAAAGTGG 
GCGAAGGCGA 
GGATTAGATA 
CGCCCCTTAG 
TGAAACTCAA 
AGCAACGCGA 
TCCCCTTCGG 
TGTTGGGTTA 
GCACTCTAAG 
ATG CCCCTTA 
CCGCGAGGTC 
ACTACATGAA 
CGGGTCTTGT 
GTAACCTTTT 
AGGTAGCCGT 
TCTTCTTCAG 
ACATTCAAAT 
GCTTGACTAA 
CCAAGCAAAA 
CTAGTGTTCG 
CGTAACTTCA 
GGGCGCACGG 
GCTTTGGGGA 
GAGTTATGTC 



ATGGGOGAAA 
TCTGTTATTA 
AGAAAGCCAC 
CCGGAATTAT 
CGGCTCAACC 
AATTCCATGT 
CTTTCTGGTC 
CCCTGGTAGT 
TGCTGCAGCT 
AGGAATTGAC 
AGAACCTTAC 
GGGACAAAGT 
AGTCCCGCAA 
TTGACTGCCG 
TGATTTGGGC 
AAGCAAATCC 
GCTGGAATCG 
ACACACCGCC 
AGGAGCTAGC 
ATCGGAAGGT 
AAGATGCGGA 
ATTTTTTGGT 
AAAGAAATTG 
CCGAGTGAAT 
AAAGAACACT 
TGTTAACGTT 
TGGATGCCTT 
GCTCTAAGTA 
ATGTTATCGA 



19860 
19920 
19980 
20040 
20100 
20160 
20220 
20280 
20340 
20400 
20460 
20520 
20580 
20640 
20700 
20760 
20820 
20880 
20940 
21000 
21060 
21120 
21180 
21240 
21300 
21360 
21420 
21480 
21540 
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GAGGAAGAGA AAGAAAATTC GATTCCCTTA 
ACCAACAAGC TTGCTTGTTG GGGTTGTAGG 

5 TTAGACGAAT CATCTGGAAA GATGAATCAA 

TGTCTCTCTT GAGTGGATCC TGAGTACGAC 
AGGACCATCT CCTAAGGCTA AATACTCTCT 

10 GAAAGGTGAA AAGCACCCCG GAAGGGGAGT 

GTAGTCAGAG CCCGTTAATG GGTGATGGCG 
GATTTGATGC AAGGTTAAGC AGTAAATGTG 

15 CGTTTAGTAT TTGGTCGTAG ACCCGAAACC 

CAGGTAACAC TGAATGGAGG ACCGAACCGA 
GGGTAGCGGA GAAATTCCAA TCGAACCTGG 

20 

GGGCTAGCCT CAAGTGATGA TTATTGGAGG 
CGGGTTACCG AATTCAGACA AACTCCGAAT 
TGGGTGATAA GGTCCGTGTT CGAAAGGGAA 

25 

ATATATGTTA AGTGGAAAAG GATGTGGCGT 
GCAGCCATCA TTTAAAGAGT GCGTAATAGC 
GTACCGGGGC TAAACATATT ACCGAAG CTG 

30 

CGTTCTAAGG GCGTTGAAGC ATGATCGTAA 
CCGQTGTGAG TAGCGAAAGA CGGGTGAGAA 

35 AGGAAGGCTC GTCCGCTCTG GGTTAGTCGG 

TGGAf AACAG GTTGATATTC CTGTACCACC 
tAGGATAGGC GAAgcGTGcG ATTGGATTGC 

40 AAATCCGGTA CTCGTTAAGG CTGAGCTGTG 

TTGATTTCAC ACTGC CGAGA AAAGCCTCTA 
GACACAGGTA GTCAAGATGA GAATTCTAAG 

45 GGCAAAATGA CCCCGTAACT TCGGGAGAAG 

GCCGCAGTGA ATAGGCCCAA GCGACTGTTT 
AGGTGATGTA TagGGcTGAC GCCTGCCCGG 

60 CTGCGAAgCT ACGAATCGAA GCCCCAGTAA 
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GTAGCGGCGA GCGAAACGGG AAGAGCCCAA 21660 

ACACTCTATA CGGAGTTACA AAGGACGACA 21720 

AGAAGGTAAT AATCCTGTAG TCGAAAATGT 21780 

GGAGCACGTG AAATTCCGTC GGAATCTGGG 21840 

AGTGACCGAT AGTGAACCAG TACCGTGAGG 21900 

GAAATAGAAC CTGAAACCGT GTGCTTACAA 21960 

TGCCTTTTGT AGAATGAACC GGCGAGTTAC 22020 

GAGCCGTAGC GAAAGCGAGT CTGAATAGGG 22080 

AGGTGATCTA CCCTTGGTCA GGTTGAAGTT 22140 

CTTACGTTGA AAAGTGAGCG GATGAACTGA 22200 

AGATAGCTGG TTCTCTCCGA AATAGCTTTA 22260 

T AGAG CACTG TTTGGAOGAG GGGCCCCTCT 22320 

GCCAATTAAT TTAACTTGGG AGTCAGAACA 223 80 

ACAGCCCAGA CCACCAGCTA AGGTCCCAAA 22440 

TGCCCAGACA ACTAGGATGT TGGCTTAGAA 22500 

TCACTAGTCG AGTGACACTG CGCCGAAAAT 22560 

TGGATTGTCC TTTGGaCAAT GGtAGGAGAG 22620 

GGACATGTGG AGCGCTTAGA AGTGAGAATG 226 80 

TCCCGTCCAC CGATTGACTA AGGTTTC CAG 22740 

GTCCTAAGCT GAGGCCGACA GcGTAGGCGA 22800 

TATAATCGTT TTAATCGATG GGGGGACGCA 22860 

ACGTCTAAGC AGTAAGGCTG AGTATTAGGC 22920 

ATGGGGAGAA GACATTGTGT CTTCGAGTCG 22980 

GATAGAAAAT AGGTGCCCGT ACCGCAAACC 23040 

GTGAGCGAGC GAACTCTCGT TAAGGAACTC 23100 

GGGTGCTCTT TAGGGTTAAC GCCCAGAAGA 23160 

ATCAAAAACA CAGGTCTCTG CTAAACCGTA 23220 

TGCTGGAAGG TTAAGAGGAG TGGTTAGcTT 23280 

ACGGCGGCCG TAACTATAAC GGTCCTAAGG 23340 
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TGTCTCAACG AGAGACTOGG TGAAATCATA 
AGGACGGAAA GACCCCGTGG AGCTTTACTG 

5 TACAGGATAG GTAGGAGCCT TTOAAACGTG 

ATACTACCCT AGCTGTGTTG GCTTTCTAAC 
TCAGGCGGGC AGTTTGACTG GGGCGGTCGC 

10 TTCCCTCAGA ATGGTTGGAA ATCATTCATA 

GAGACCTACA AGTCGAGCAG GGTCGAAAGA 
AAGGGCCATC GCTCAACGGA TAAAAGCTAC 

IS 

AGTTCACATC GACGGGGAGG TTTGGCACCT 
AGTCGGTCCC AAGGGTTGGg CTGTTCGCCC 
CGTCGTGAGA CAGTTCGGTC CCTATCCGTC 

20 

CTTAGTACGA GAGGACCGGG ATGGACATAC 
ATAGCTGGGT AGCTATGTGT GGACGGGATA 
CCTCAAGATG AGATTTCCCA ACTTCGGTTA 

26 

GGTTCGAGGT GGAAGCATGG TGACATGTGG 
AATCAAAATA AATGTTTTCC GAAGCAAAAT 

30 ATAAATTAGA TTCATATGTC TGGTGACTAT 

AACACAGAAG TTAAGCTCCT TAGCGTCGAT 
AACGTTGCCA GGCAAAAAAT GGATGCGATG 

35 TTTATGTCTA AAACGTCAAA ATAAAAAGCA 

AAACDTTTGA ATCTGACGAA ACGAGAAAAG 
TAAGyGAGAG CCGAAGrAGA GGAAAGAAGC 

40 TAGCGASGAT GGTAGCCAAC TTACGTTCCG 

AATGTACACT TTCGATTGTC TAAGTATGTA 

AAATGATATC ATCGAAAACA AAATATTGTA 

45 

AATTGAAAAT GATCTTACTG CTCTTTTATA 

TTATTATACA ATAGACAAGC TATTGCATAA 

CTTTATAATT AATGATTTTA TTAGAGCGTC 

SO 

ACCGCCAAAG CCTAATATAA ATTTAGGGGT 



GTACCTGTGA AGATGCAGGT TACCCGCGAC 23460 

TAGCCTGATA TTGAAATTCG GCACAGCTTG 23 520 

AGCGCTAGCT TACGTGGAGG CGCTGGTGGG 2 3 580 

CCGCACCACT TATCGTGGTG GGAGACAGTG 23 640 

CTCCTAAAAG GTAACGGAGG CGCTCAAAGG 23700 

GAGTGTAAAG GCATAAGGGA GCTTGACTGC 23760 

CGGACTTAGT GATCCGGTGG TTCCGCATGG 23820 

CCCGGGGATA ACAGGCTTAT CTCCCCCAAG 23880 

CGATGTCGGC TCATCGCATC CTGGGGCTGT 23940 

ATTAAAGCGG TACGCGAGCT GGGTTCAGAA 24000 

GTGGGCGTAG GAAATTTGAG AGGAGCTGTC 24060 

CTCTGGTGTA CCAGTTGTCG TGCCAACGGC 24120 

AGTGCTGAAA GCATCTAAGC ATGAAGCCCC 24180 

TAAGATCCCT CAAAGATGAT GAGGTTAATA 24 240 

AGCTGACGAA TACTAATCGA TCGAAGACTT 24300 

CACTTTTACT TACTATCTAG TTTTGAATGT 243 60 

AGCAAGGAGG TCACACCTGT TCCCATGCCG 24420 

GGTAGTcGAA CTTACGTTCC GCTAGAGTAG 244 80 

AGCCGCATTG AGACCGCAAG GTCTCTTTTT 2454 0 

AACACAAAGA AAAATGGCTT GGCGAAGTGA 24600 

ArCGCAACGA GTTTAGTAGA GCTAAATGAG 24660 

AAGCGATTGT CACAAGTCAA GAAAGGTTCT 24 720 

CTAGAGTAGA ACTGGAAATG ATAATTTAAT 24780 

CAACTTTAAT TTTGTGTTTA TATAAATTTA 24840 

T AAATAG AGA AGAGGAGTAA GACGGTATCT 24900 

TACTTTATTG AAATACAAAA AGGAAATTAA 24960 

GTAACACTAA CTTTTATCAA AGAAGTGTTA 25020 

TACATGCGGT TTTAAAGCAT CATCGTCTAT 25080 

TTTCTTATAG TCTTGATCAT CATCAAAATT 25140 
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TCCATTTTTT ACTGTAATTG TAAAATGCAT ACCCGTTTCA GCACCTTGAA TATCAAGCTG 25260 

CTCTTTGTAA GGTTTCAATC TTTTTAAAAT ATAGGTTAGT TTTCTACGAT AAATTCGTCT 25320 

CATTTTATTT AAATGCCTTT CAAAACCACC GGAAGATATA AACGTTGCAA TAAGGTTTTG 25380 

CATATGAACA GGTACAGTGT TGCCTTCAAT GTGATTTTGA GAATGATATT TTTTCATTAT 25440 

AGAATAGGGT AACACCATAT ATGCAACTCG ACAGCTAGGA AAAATAGACT TTGAAAATGT 25500 

ACTGATATAA ATCACTTTTT CTCCTCTTGA ATATAGACCT TGAATTGCTG GAATGGGTTT 25560 

GCCGAAATAT CTAAACTCGG AATCATAATG ATCTTCTATA ATAAATCGTT CTTCTTTTTC 25620 

TTGAGCCCAT TGTATTAATT GAGTTCGTTT TTTTAAGTCC ATCACATATC CAGTTGGAAA 25680 

TTGATGGGAA GGCGTTATAT ATACTATATT TTTTTGTGAT TTAATAACTT CATCTACGTT 25740 

TATTCCATTA TCTTCAACTT CAATTTGTTC ATATTCAACT TGTTTTTTAT CTAAAATATT 25600 

TTTGATTGGT GGATAACTAG GTTTTTCGAT AATAAATGTT GAAGTATAAA GTAAATCGAC 25860 

TAATTGATTT ACTAATTGTT CGGTAGATGA GCCAATTATA ATTTGATTAG GATCACAAAT 25920 

TACGCCACGA TTAGTAAATA AATAAAATGC CAGTTGAAAC CGCAAATGTA ATTCTCCTTG 25980 

AAAATGTCCT CTACGTAATT GATTTAAATG ATTTGTATCA TAAAGATCTT TGGAATACTT 26040 

TCTGAAAAGT TCTATAGGGA AATGTTTCGT ATCTATTTCA TCCAAATTAA AAGCATAATC 26100 

ATAAGCTTCA TCACTCGCTT TTGGTTTATA TGAATCATCA TCAAAAAGAG AGGGGATAGG 26160 

TTGATTGTTT AAAATTGTTA AAGATTCAAT TTCGGACACA AAATATC CAG AGCGAGGTCT 2622 0 

TGAATAAATG TAACCTTCGT CTAATAGAAG TTGATATGCA TGCTCTACGG TTGTTTGGCT 26280 

AATAGATAAA TGTTTGCTTA ATTGTCTTTT AGAATAAAAT TTATCGCCTT CTTTAAATTG 26340 

3S ACCTTCAATT ATTTGTTTTT TTAATTTTTC ATAAAGTTGA TGGTATAAAG TGTTTTTCAA 26400 

TTTXATAACT GACCTCCTAA ATTTATCTTA TTTTGTACCT TTTTAAATAT CAGTTTATAC 2 6460 

ATTACAATGT ATTTAATCAA CTTGAAAAGG GGTTTTATGT ATAATGAGTA AAATTATTGG 26520 

40 ATCAGACAGA GTCAAAAGAG GTATGGCTGA AATGCAAAAA GGCGGCGTTA TTATGGATGT 26580 

CGTTAATGCT GAGCAAGCAA GAATTGCAGA AGAAGCTGGC GCGGTAg CAG TTATGGCATT 26640 

AGAACGAGTA CCTTCTGATA TTAGAGCTGC TGGTGGTGTT GCACGTATGG CAAACCCTAA 26700 

45 AATTGTAGAA GAAGTAATGA ATGCTGTTTC TATTCCAGTC ATGGCTAAAG CACGTATTGG 26760 

TCATATCACT GAAGCAAGAG TATTAGAGGC GATGGGTGTT GACTATATTG ATGAATCAGA 26820 

AGTGTTAACA CCAGCAGATG AGGAATATCA CTTAAGAAAA GATCAATTTA CAGTACCATT 26880 

TGTATGTGGA TGTCGTAATT TAGGTGAAgm TGCGCGTAGA ATTGGTGAAG GTGCTGCTAT 26940 
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ACAAGTTAAT TCAGAAGTTA GTCGATTGAC TGTAATGAAT GATGATGAGA TTATGACTTT 27060 

TGCGAAAGAT ATCGGTGCGC CTTATGAAAT TTTAAAACAA ATTAAAGACA ATGGTCGTTT 27120 

ACCGGTAGTT AACTTTGCAG CTGGTGGCGT TGCQACTCCT CAAGATGCTG CTTTAATGAT 27180 

GGAATTAGGT GCTGACGGTG TATTCGTTGG ATCAGGTATT TTTAAATCAG AAGATCCAGA 27240 

AAAATTTGCT AAAGCAATTG TTCAAGCAAC AACACATTAC CAAGACTATG AACTAATTGG 27300 

AAGATTAGCA AGTGAACTTG GCACTGCTAT GAAAGGTTTA GATATCAATC AATTATCATT 27360 

AGAAGAACGT ATGCAAGAGC GTGGTTGGTA AGATATGAAA ATAGGTGTAT TAGCATTACA 27420 

AGGTGCAGTA CGTGAACATA TTAGACATAT TGAATTAAGT GGTCATGAAG GTATTGCAGT 27480 

TAAAAAAGTT GAACAATTAG AAGAAATCGA GGGCTTAATA TTACCTGGTG GCGAGTCTAC 27540 

AACGTTACGT CGATTAATGA ATTTATATGG ATTTAAAGAG GCTTTACAAA ATTCAACTTT 27600 

ACCTATGTTT GGTACATGCG CAGGATTAAT AGTTCTAGCG CAAGATATAG TTGGTGAAGA 27660 

AGGATACCTT AACAAGTTCA ATATTACTGT ACAACGAAAC TCATTOGGTA GACAAGTTGA 27720 

CAGCTTTGAA ACAGAATTAG ATATTAAAGG TATCGCTACA GATATTGAAG GTGTCTTTAT 27780 

AAGAGCCCCA CATATTGAAA AAGTAGGTCA AGGCGTAGAT ATCCTATGTA AGGTTAATGA 27840 

GAAAATTGTA GCTGTTCAGC AAGGTAAATA TTTAGGCGTA TCATTCCATC CTGAATTAAC 27900 

AGATGACTAT AGAGTAACTG ATTACTTTAT TAATCATATT GTAAAaAAAG CATAGCTTAA 27960 

TGTATGCTAA ATCAACGAAT TATTGATATT TATAGATTTG TTGAGAAGAA AATATCTCCT 28020 

TCAAACTTAG CTTTGGAGGA GTTATTTTTT ATGTCAAAAT TAAAAATG AT AAAAAATAAA 28080 

GCTATACATA AGAAAAAAAC CCTTCAAAGA GACTGAGAAT AGTCAAAATT TTGAAGGGGT 2 8140 

TAATTCGATG TTGATGTATT TGTTAAATAA AGAATCcAGC GATTGCAGCT GAAATGAAAG 28200 

ATACTAGTGT tGCACCGAAT AATAATTTCA AACCAAAGCG GGCAACTGTA TCTCCTTTTT 28260 

TGTCATTAAG TGATTTAATC GCACCTGAAA TAATACCGAT AGAGCTAAAG TTAGCAAATG 28320 

ATACTAAGAA TACAGATGTA ACACCTTTTG CGTGTTCAGA TAAATCACTA AGTTTACCAA 28380 

GTGCTTGCAT TGCTACAAAT TCGTTAGATA ATAGTTTTGT CGCCATAACT GAACCGGCTT 2844 0 

GAACTGCATC TTGCCATGGC ACACCGACTA AGAATGCAAA TGGTGCAAAG ACAAAACCAA 28500 

TTAATGTTTG GAAATCCCAA GAAATAGCGC CACCTGAAAC TGTACTAAAG ATATTGCTTA 28560 

CAATTCCATT TAATAGAGCG AT AATGG CAA TGTATCCGAT TAACATTGCG CCTACAATGA 28620 

CAGCTACTTT AAATCCATCT AAAATATATT CTCCTAGCAT TTCGAAGAAT GATTGTTGTC 28 680 

TTTCTTCAGT TTCTTCAACT AATAATTTGT CATCTTCTTC ATTAACTTTA TAAGGGTTAA 28740 
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TAGQTTCAAT TAAGGTAAAG TATGCACCGA TAATTGAAGC 
AAGCTGTTAA TOTGTATAAA CGTTGCTTAG GTATGTATGG 
TAAATACTTC AGATTGTCCC AAAATTGCTG CAGCAACTGC 
CCATACCATT AATTTTAGAA ATTAAGAATC CTAAAACATT 
TTGTGTATTG AAGGATACCG ATAATCGCTG AAATAAATAC 
AGAAGAATGG TGGTTGCTTA GGATCGATAT ATTGAATACC 
CATCTGCTGC TTTTAATAAT AAGTAGTTAA AACCGTTTGA 
TTCCCATTGT AGTTTTAAGC AAGATAAATG CAAAGATAAG 
CTACATATTT CCAGCGAATA TTTTTCCTGT CTGAGCTAAA 
AGAAGATAAT TCCGATAATC CCAATTAGAA T ATG CAT AT A 
TTCTACaATc TATCATACAA TAAAATGGAA GGGCTAACAT 
AAAACAAATT AATTGAAAAA GGTCAAAATA GGTCATATAA 
AAGGGGTGAT ATACATGCAC AATATGTCTG ACAT CAT AG A 
TGAAGAGTCG AATGAAGATG TCGTTGAAAT TCAGAGAGCG 
TTGCGTACCA TCACAATTAA ATTATGTAAT CAAAACACGA 
TGAAATCGAA AGTAAACGTG GTGGTGGTGG TTACATCCGA 
AGATGCAACA GGTTATATTA ATCATTTGCT TCAGCTGATT 
ACAAGCTTAT TATATTATTG ATGGGCTTTT AGATAAAATG 
TAAAATGATT CAAGCAGTTA TTGATAGAGA AACGCTATCA 
TATTATTAGA GCAAATATTT TAAAACGTTT GTTACCAGTT 
ATGAGGTGTT GAAGTGCTTT GTGAAAATTG TCAACTTAAT 
AGTTACAAGT AAAAATAAAA CAGAAGAAAA AATGGTGTGT 
CCATCCGTGG AATCAAGCTA ATGAACAACC TGAaTATCAA 
AGAAGCATTT GTTGTTAAGC AAATTTTACA ACATTTAGCT 
TCAAGA 

(2) INFORMATION FOR SEQ ID NO: 57: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 14333 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



AGAAACAGTC GACATTGCTG 28860 

TAATTGTTTT TTAATTGAAA 2 8920 

ATTGTATGAT TCTAAACGTC 2 8980 

AATGATTAAA GGTAAAATCT 29040 

GATAGGTAAT AATACACTGA 29100 

ACCGAATACA AAGTTAACAC 29160 

AATACCACCA ATAACCTTGA 2 9220 

CTGAATTGCA AGTAAAATTC 29280 

TAGAAACGCA AGTGCTAAAA 29340 

TTTCTCATTC CTTTAGTTTT 29400 

CATAAATTTT TGAAAATATA 29460 

TATAGTCAAA GAAGGTCAAA 29520 

ACAATAaTCA AACGTTTATT 29580 

AATATCGCAC AGCGTTTTGA 29640 

TTCACTAATG AACATGGTTA 29700 

ATCACTAAAA TTGAAAATAA 29760 

GGACCTTCTA TTTCTCAACA 29820 

TTAATAAATG AACGTGAAGC 29880 

ATGGATATGG TTTCTAGAGA 29940 

ATAAATTATT ACTAAATGAA 30000 

GAAGCGGAAT TAAAAGTTAA 3 0060 

CAAACTTGTG CTGAGGGGCA 3 0120 

GAACATCAAG ATAATTTCGA 30180 

ACGAAACATG GAATTAATTT 30240 

30246 
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<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 57: 

TATTCCCCCA TCGGTTTATT AAATCGTCCA TTTCAATACT GTTTTTCCCC AAGATGTCGA 60 

TAAATCCATT TCAAACGCTT GGACOATATC TTGCATCGTA CATACATTAA TTTCATGTCC 120 

TTTTAATAAT GCTAACTTTT CAACTATGTC TGGGTACTTA CGATATAAAT CAACAACTTG 180 

CTCAAAATCT TTAGAGCCGC TTCGACTACT ACCAATCAAC GTTAATCCTT TTTCAAGTAC 240 

TAATCGTGTA TTCACTTCCA CGGGTAATTC ACTTACGCCT AACAAAGCAA TACTGCCTTC 300 

TGGTGAAATA TGTTCAACTA TTTGTTGAAG TGCAACTTGA CTTCCTTTAC CTCCAACACA 360 

TTCAAATGCA TGATCAATTT TAAGATCATC TGGTATTTGA TTTACTGTAA AGATGTCATC 420 

TACAAATGAA AAATGACTTA ATTTATAGTC TGTCTTACCA AATACATAAG TTTTAGCTTC 4 80 

TGGGTACAAC TTACGTAGCA AAATAGCAGT AATATAACCT AAGTTACCAT CACCCCAAAT 540 

20 ACCAAAGCTG GTTTTCAAAG GTATAGATTT ACGTTCAAAT CGTTGTATAG CATGATAACT 600 

TACTGACACT AACTCTGTGT ATGAAATCGT ACTCAAATCA ATGTCATTAG GCAGCGGAAC 660 

GATACGATCA TGTGCCATCA CAACGTAGTC TTGCATAAAA CCATCATAAC CACTAGATCT 720 

AAAATAACTA GAGGCTAAGT AATTCTCCGC AATAATATGA TGTTGCTCTG TAGGTGTATT 780 

CGGTACGATT ACTACTTTCG TACCTTTTTC AAATACCCCT TTACTATCAA ATACAACTTC 840 

ACCAACAGCT TCATGAACTA ATGACATTGG TAATTTTTTG CGTAGTACAT TTTCATCTCT 900 

TCGACCTGTG TAATACCTTT GATCAGCTGC ACAAATAGAC AAGTATAAAG GTCTTACGAT 960 

GACATGATTA CCATAAATAT CAACATTATT ATATGTGACG TCGAACTGTC TCGGTGCAAC 1020 

GAGTTGATAT ACTTGATTAA TCATCGGCAA TATCACCTTG AATAATGGCA TTTGCTACTT 1080 

TTAAATCATA CGGTGTTGTC ACTTTAATGT TGTATAGTTC TCCaCGTACC AATTTAACTG 1140 

CAT^TCCAGA TTCGACAATG ATTTTACATG CATCTGATAA GATTTCTTTT TGTTCACTAC 1200 

40 TTAAGGCGCG ATAACTATCT TGTAATAATT TAATATTAAA TGATTGTGGT GTTTGGCCTT 1260 

GATACATTTC ATTCCTTACA GGGATACTGT GTATGTTCTG TTTATCTTTA GACATTACAA 1320 

TCGTATCAAT TGCTTCAATG ACTGTATCTA CTGCACCATA TTTTGCTGCT ACTTCAATGT 1380 

45 TCTCTTTAAT AATACGTTGA GTTAAAAATG GTCTTACGGC ATCATGAGTT ACAATCACAT 1440 

CATCATTATT AATTCCATTT ACATTGCGAA TATGGTCGAT AATGTTCATA ATTGTTTCAT 1500 

TTCGATCCGT ACCACCTGCA ACTACTTTGA CACGTTGATC TGTAATGTTA TATTTTTTTA 1560 

60 

AAATATCCTG TGTATGGGAA ATCCACTGTG CTGGCGTTGC GATAATAATC TCATTAAATT 1620 

CACTCACTAA AATGAACTTC TCAATTGTAT GGATTAAAAT CGGTTTATTA TCAATATCTA 1680 
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CTGCATAAAT CATGTTGTCC TCCATTCTGT 
ACCTATGCCC GCACATAAGC CTAACCTATT 

5 

TAGTTGTCAC AATAGTGTGA TAATTTTTTA 
AAGTTGTTTT GCCATGCAGT TAATCATTAA 
AATGTTTACT CTTTTTCAAA TTCATTATTA 

10 

ATTTATC TTA TTAAGTGGCT GTACTTGATT 
CTCATTTTAA GTATACAAAA TGCAAAACAA 

1S ACCGGCTATT TATCAACGTA TATTCGAAGA 

ACGGCATTCG CACTTTCATA GCTATAACTA 
CTAATAAATC GTAAACATGA CTTTATCAAA 

20 TGTCTCCGGG CCTTTTTCTA ACGGTAAAAA 

TTTCGTCTTC ATATAATGTA AGGTTGCCGT 
ACAGTTCCAA GAGCCACATA CTGTCAACTC 

25 ATCAATCTCA ATATCATCAT ATGGTATTCC 

TAGCGTCAAT ATTTGACCAA TCGTAACTTT 
TTGATTGGCG TAATGATTTT CGATGAATTT 

30 

TTGATGTGCG CCCAATGATG TTGCAATATC 
GATATGTGCA GCAC CAAAT A TTCGTGCCCA 
CCCCATTACT GCAACAGTCA TACCAGGTTG 

35 

AACGGCTGAT GGCTCAACCA TTGCTGCTTC 
AACATTTTGC GCTGGCAATT TGACATATTC 

40 GACGAATAAC TTTTCACATC GTGCATATTC 

AGGTATTGCT GGGCAACCTG TCACTTTGTC 
AATGGCATCT ACTACACCTG AAAATTCATG 

45 CATTTTTTTG TATCGTGACG TGTCTGAACC 

AACGTCATTC GCACTTTCAA TGACTGGCTT 
GCCATATAAT TTCAATGCTT TCACTTGTAA 

50 

TTTTTCTTTT TAAAAATACC TGTCGCAAAA 
AGTAAATGTT CCATATAAAA ATCAGTGATT 

55 



CATTACATCA TTTCCATTTA TACATTACTG 1800 

GCTCACTTGC CTCTTTTATT AATCCAAAGA 1860 

T AAAAATG T A TTTTTGTAAC TGACCATTCT 1920 

CTCTGACGAT ATTAAATTGT TAAAGGTATT 1980 

CTGCCATCAT TTTACCATAT ATTATAATAA 2040 

TTCACTTTAA AAATTATCAA ATATTGCCAT 2100 

CCGATTCACA AGCATATTTC ACACAAGTAA 2160 

TGAATTATTT CGATAGTATC TATAGACCAG 2220 

TACCAGCGTT TTCGTCCTCA AAGGTGCATA 2280 

TCX3TTCTTTC TTGTTAACTA ATTTATCAAA 2340 

ATGAGAAATA ATAGGCTTTA CATTAATATC 2400 

CCACTCTTTG CCCGGAAAAT TACTGGACAA 2460 

GTTACGCAGA ATTTTTTCAA AATGAACGCG 2520 

GAGTAATACC ACCTCGCCAC CTTTTTTAGG 2580 

AGCACCTGAT GATTCTATAG CTAAATCGAT 264 0 

CTCAAGATTT TCTTCTTTTG AATTGATTGT 2700 

TAGTTTATGC GCATCTATAT CTATAGCGAT 2760 

TTGAATAGCT AACAAACCTA TACTGCCACA 2820 

TATATTCGAT TTATAAAACC CATGCGCAAC 288 0 

AATGTAATCA ACATTGTCTG GAACCTTTAA 2940 

CGCGAACGAT CCAGGTTCAT ATGAGCCAAT 3000 

ACCTTTTAAA CAATACTCGC ATTGATAACA 3060 

GCCCACATTA ACATGCGTAA CATCACTTCC 3120 

ACCAAATGGC ATACCTTTAA TGTATGGCCC 3180 

ACATATGCCA GTCGCTCGTA CTTTAATAAT 3240 

TTCATTATCC TCATACCGTA AATCTTCCAC 3300 

ATCACCTCAA ATTTGATTTA ATTCACAACT 3360 

TAACCTGCAA TGACAATGGA ATTACTTACG 3420 

TGTCTTAATG GCCCAAGCAT AAAAGTTAGC 3480 
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TGCTTTAATA CCTTCGCCGG ATTTTAAATG TTGATACGCC TCGTCCCATT TCGAAATATC 3600 

ATATATTTTT GTCACCAAAG CTTCAGCATT TACTAAACCA TCCGCCATAA GTTGCAATGA 3660 

AGGTTCCCAA TCTGCTGGCT TTTGACTTCT ACTACCAACA ACTGTTATTT CTTTTTGAAT 3720 

CACTTTTTCC ATATCAAATG GAATTTCAGC ATCCTTAAAA ATACCTATTT GACTGTAGAA 3780 

ACCTTTTTTG CGTAAAATAT CCAAACCTTG TCGTGCTGCT GGAACTGCAC CTGAACATTC 3840 

AACAACAACA TCTGCACCGT AACCGTCTGT AATTCCATTG ATATACGTTT TTAAGTCTGT 3900 

TTGTTGTAAA TTGACTACAT AATCCATGTG CAATGCTTCT GCTTTATCTA ATCTGACTTT 3960 

GTCATTGTCC AATCCAGTTA CCACAACAGT TGCGCCTTTA CTTTTTAACA CTTGTCCTAC 4020 

AAGTAATCCG ATTGGCCCAG GTCCCATTAC AACTGCTACA TCGCCTGAAT TGACTTGAAT 4 080 

CTTAGAAACG CCATGATGTG CACATGCTAA TGGTTCTGTC ATAGCTGCAG ACTGATACGA 4140 

20 TAtTCGTCTG GAATATGATG CAAACTTTCT TCACGTGCAA TGACATAATT AGTAAATGCG 4200 

CCATCAACTT GTGTTCCAAT ACCTTTTCGA TGGTTGCATA AATTATAGTC TTTTGATTTA 4260 

CAGTATTCAC ACTCATTACA AACATAGAAT GTCGTTTCAG aTGtGACACG GTCACCAACT 4320 

25 TTAAAATCTT TAAOGTCTGC TCCAACTTCA ACGATTTCAC CAGAAAATTC ATGACCTAAT 43 80 

GTCACTGGAA AATTAACTTT ATAATGACCT TCATAAGTAT GAATATCTGT GCCACAAATT 4440 

CCTGCATAAT GTACTTTAAT CTTTACTTTA TCATCTAGCG GTGTTGCAAC TTCTTTATCA 4500 

AGAAGTTCTA AGTTGCCATG TCCTTCTCTT GTTTTTACTA AAGCTTTCAC CACAAACACC 4560 

TCGATTTTTA ATTGAATAGA CTAAATAGTT TAAAGATAAG ATAGTTAACG ATATTACCAC 4620 

CTTGATCAAT ACTTGAAATT TCAGATGAAC CTTTTGGCAT TTGTACATTC GTACCTTTCG 4680 

CCATATCTGT GAAAATGGGT GCTAOGTCTG TTGCAATATA TAGTGAAATT GCAATCATAA 4740 

TCGTACCCAC AATGACAGAA TGAATAATGT TTCCTCTTGC TGCACCAACA ATAAACGCGA 4800 

CAACAAATGG TATCGTTGCT AAGTCACCAA AAGGTAGTAC TTGGTTTCCT GGTAAAATAA 4860 

CGGCTAATAA AACAGTGATA GGTACTAAAA TTAATGCTGT CGAAATAACT GCTGGATGAC 4920 

CTAATGCTAC AGCCGCATCC AATCCAATAT AAATTTCACG TTCGCCAAAA CGTTTATTTA 4980 

45 GCCATGTTCT TGCAGACTCT GAAACTGGCA TTAAACCTTC CATTAAGAXT TTTACCATTC 5040 

TAGGCATTAA TACCATTACT GCAGCCATTG ACATTCCTAA ATTAATGATG TCTCCAGGTT 5100 

TGTAACCTGC TAACACACCA ATACCTAAAC CTAAAATTAA GCCGACAAAT ATAGACTCTC 5160 

50 CAAATGCGCC AAAACGTTTT TGAATTGTTT CAGGATCAGC ATCTAACTTA TTCAGACCGG 5220 

GTACTTTTTG TAACAATTTA ACTAAGTAAA TACCTGGTGC ATAAGAAATT GTACTTCCTG 5280 
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SS 



CTACTTTCAA 


ACAGATAATT 


TGGAAAATAA 


CTGCTGCTAA 


TAACGCTTGC 


CAAATACTGC 


5400 


CTGATACGGC 


ATAAACCATT 


GCTGCTGTAA 


ACGTATAATG 


CCAAAAATTC 


CAAATATCTA 


5460 


CATTCATCGT 


CTTTGTCACT 


TTAGTTACTA 


GCAATACAAC 


GTTAACTATG 


ATTCCGAGTG 


5520 


GAATAATAAA 


TGCTGCGACA 


GATGATGCCC 


AAGCGATAGA 


TGATGTTGCT 


GGCCAACCTA 


5580 


CATCAATCAC 


ATTCAGACTG 


ACG CCTAAAT 


TTTTAACCAT 


CGCTTGTGCT 


GCTGGCCCTA 


5640 


AATTTTTAAC 


TAATAAATCG 


ATGACTAAGA 


AAATCCCTAC 


AAAAGCCACA 


CCTATTGTTA 


5700 


AACCAGACCT 


AAATGCCGCT 


CCAATTTTCT 


GCCTAAAGAA 


TAGGCCAAGC 


AAGAATATGA 


5760 


CAACCGGTAA AATAACAGTt 


GCACCTAAAT 


CTAAAAATCC 


CCTTACAAAA 


TCAGTGAAGT 


5820 


AACTCATATT 


TAAACCCTCC 


CTGTTATATA 


TGCATTGTCA 


CGATACTTTC 


CGATTGTGAT 


5980 


TACATTTGAC 


GTTACAGTCA 


TTTCAACGAC 


AACCCTTGCT 


AAATTOGACT 


GCAGTCCTTT 


5940 


TGAATTACAG 


tCACTGCGTT 


TCTATGTCAT 


CAACAATCAT 


TTGTCGTGAT 


AGTCATTTAT 


6000 


ATGCAATTTG 


CATATATTAA 


TATGTTATCG 


ACCCACGTTA 


CATATCAATT 


CCGTTATTTT 


6060 


TGTAACTCTG 


TTAAGATTTG 


TTGTTTTGTT 


TCTTCAATAC 


CAATACCAGT 


TAAGAAATTA 


6120 


CGTGCGTTGA 


TAACTGGGAA 


TTTATATTCT 


TTTTTTGTCA 


TTGCAGTTGT 


AACTAATAAA 


6180 


TCTGCAGTGT 


CTTCATAAGG 


TCCAACTTCT 


GTAATTTTGA 


TTTGTTTAAT 


ATCTACTTTA 


6240 


ATATTGTGTT 


CCTTTGCCAT 


TTCTTCAATT 


GCATTATTTA 


CTACTGTTGA 


CGTTGCAATA 


6300 


CCTGCACCAC 


ACGCTACTAA 


TACTTGTTTC 


ATTTTCAATT 


C CTCCAATT A 


ATTTTTAGTT 


6360 


ATATTCCAAA 


TAATCATTGA 


TTAGTGTTGC 


TAAAATTGTT 


TCATCTTTCG 


TTCGTAGAAT 


64 20 


CTGCTCCAAT 


TTTTCTTCAC 


TTTGAAAAAT 


TTGCATCAAC 


TGTTGTAACA 


GCTTAAGTTG 


6480 


ATCATCTACT 


TTATCCATTG 


CTAACATAAA 


AACGATTTTC 


ACTTCTGTCT 


GTTGATCAAG 


6540 


TGTTCCCATT 


TCAATAAACG 


GCACTTCTTT 


TTCTAGAACA 


GCCACACCTA 


TCGTTCTATG 


6600 


GTTAATATGT 


TCGACATCTG 


TATGCGGTAT 


AGCGACCGAA 


CATAGATGCG 


TTGGTAAACC 


6660 


AGTAGCAAAT 


TCTTTTTCTC 


TGTCGATGAC 


TGCATCTTTA 


AACGTTGACT 


TCACGAACCC 


6720 


ATTTTGAAAT 


AACACATCTG 


ACATTTGTGA 


CAATACGGAT 


T f"*T*PT ATfV j^a 




O / O \J 


ATTGAGCATT 


ATATTTTCTT 


TATGCACTAA 


TTGCTGTCCC 


ATCCATTTTC 


CCTCGCTTCT 


6840 


TTATTTGAAT 


AATTTTTTAA 


AATCTCATTT 


ACATCAGAAT 


TTTTGCGACT 


TTGTATGATG 


6900 


CGCTTAATTG 


CGTCATTGTC 


TTGCGCCACA 


TCTCTCAATT 


GTAGTAACGC 


TCTTAAGTGT 


6960 


GTCACTTTAT 


CAACAGCAGC 


AATAGGTACA 


ATAATATGGA 


TTGCTGTGCC 


ATCTGACATG 


7020 


TATATTGGTT 


CTTGTAATAT 


CAACATACTC 


ATCGCTGTTT 


TATGTACATG 


CTTTTCAGAG 


7080 



442 



EP 0 786 519 A2 



10 



TGCATCTCAT GAATATATTT AATATCAATA AAATGATTAG CAACTAACAC ATCACTTGCT 7200 

TTAGCAATAG CTTCATCAAT ATTTTCAACA TGATGCATTC TTTTCACGTG CCTTGCCGGT 7260 

ATCAAGTCAG CTAAATCTAA TGyCTwATTT tGTGtGACaA TCGATCCATT AATGGTTGAA 7320 

ATTGAATTAT AATTGGCAAT AAAATCTTCT AAACCATCAC GTAGTcTGTA ATGTCATTAA 7380 

CTGTCGTTGT GCGTTCAATT AATGCCATTA ACTTGTTTAT TTCCTTATCA ATGTCAGCCG 7440 

ATTCCTTATT AATGTACTTC ATCACTTCTT TACGTAACTT TCGTTGCTCA TTTTCAGATA 7500 

AAGCTACTTT TGTGATAAAT AATTTTTTAT GTGTTAGGAC AAACATTGGT GAAAAGACGA 7560 

1S TGTCATAATC TAATGTGTAA TTTTCAAATG TTCTAAGTGA AATCGCATCT AAGAAAATAA 7620 

TTTCTGGAAA TAAGTTTCGC AACTCGTATA ACATCATTTG TGATACTGAC GTGCCTTGTG 7680 

TACACACGAT AATAGCTTTT ATCTTGCCAT CGAAGTTTTC ATCTTGACGT CTCAAACTAC 7740 

20 CTCCGAACAA CATGGTTAAA TATGCTATTT CATTATCAGG CAACGATTTT CCGAAATATT 7800 

CAGTTAACGA TTGACATGAT TGTTTCACCA TATGAAATAA GGATTGATAA TTTCCTTGTA 7860 

AAGGATTTAT - TAATTCATCA CGATCCGTTA AGTTATATTT AATCCTATAA AAAGCAGGCG 7920 

TTAAATGTAA CAAGAGTTGC TGTGATAATT TCTCCTTATC TTCAATGTTA ATAAAAGTGA 7980 

TTTGTTGAAA ATGGTGAATC ATTTGAGCGA TGGCCATCGT TAAATTCGAT ATGCTATCTG 8040 

ATTCTTGCAA ATCAGTCCAT TGCACACTTG TTGAAAGTAA GTGTAATGTC AAATATAACT 8100 

TTTCCGCTTC TGGCAAATCC GGCTCATGTT GCGTCATAAT CTCCGTTGCT TGATATTCTT 8160 

TCGTATCCCT CAAATACTGA TAATTAATAT TTAATGGATT CATCACATGA CCA C TTTGAA 8220 

TTCGTCTACG AATCACACAA AGGACATAAG GCAATGAACT AAGTGATTTG TCTATAAAGC 82 80 

GACTCTTCAA AAATTGTTCT ACCTGTTTGA TCTTGTCTTT TTGATATGCG ATATCTTCGA 8340 

ATCfiAAGTT GAGCGCCTTT AAAACTTCAC TTTTAGTAAT ATCATGATTC AACCTTTGAT 8400 

40 CAATCAACTT AATGAAGAAA CGGCGAACTT CAAATTCATC ACCAACAATT TCATAACCAT 8460 

GTTTTCGAGA ATACTTAAGT GACAAACCAT GATTTTCCAA TTGCTCTTTC ACATGATTTA 8520 

TATCGTGAAT GACAGTATTT TTACTGACTT GTAAATCAAT TGAAAAATGG TTTAGAGACA 8580 

45 TTGCGTTTTC CTTACTAAAA AGCATGAGCA TTAAATAATA ACGACGTGTT TCTATGCTAA 8640 

AAATGACATT GTTGCCGTTT AACATTTGCT GCTCCGATAC ATCTCGCTTG AATAACGTCA 8700 

TGATTTCAGA ACTTACAATA AAATTTCCTT GGCTTGTTCT TTCAAGTTTT GGATAACCCT 8760 

60 

CTTGTTCAAG CCACAAATTG ATTTTTTGAA TGCGATATCC TAGTTGTCTA CGAGACAAAC 8820 

CAAATATCGA TTCAAGTTCT TTACCATGAA TAGTAGGATT CAATACAATT TCTCTGAGTA 8880 

55 



25 



30 



35 



443 



EP0 786 519 A2 



10 



15 



20 



25 



35 



40 



45 



TCAATCGTCA CACCGATGTA CACACTTTGA ACACATATTT TCAAAATGAG CATGTACATC 9000 

ATTGTGATGT TTTAACAACA TTTCAATTAT ATCTATATTT TTTGTGATTT TAATCTTTTA 9060 

AAATAAAGCA ATTGAAATTT TTGCATATAT TTTTGTGTTT TGTGTTTTTT TGAAGCATTT 9120 

TTAACATACA TATCTCAATC ATTATCAAAT TGTCATGACC ATTGTAACCC AATACAAAAA 9180 

CCCTAAGGAC GCTTATATCA GGCGCCTTAG GGTTAACTGT ATCTATTTAA TTAAGTATTA 9240 

TTATTCGTAT GTACGTAACT TATGGTCTAT CAAGTTCCAC ACTTCTTCAA CATCAACTGC 9300 

TGTAGCAAAA TAAGCATTGG CAGGCTTACC TGTAACATGA TTTAAATCGA CAGCCATAGT 93 60 

GCCATAAGTT AGTGGACTTT GATGTTCAAT GTCGATATTA ACGGGTACCA TTGTAAACAA 9420 

TTCTGGTTGT AACAAATACA AAATTGTACA AGCATCATGT ATTGGACCAC CATCCATATT 94 80 

AAAGTGAGTC TTGTATGTCT TCTTAAAGAA TTGCAATAAT TCTACGACGA ACTGTGCAAC 9540 

AGGATTATTG ATACTTTCAA AGCGTTCAAT CACGTGATCG TCGGCTAAAA CTTGATGTGT 9600 

TACATCTAAA CCAAACACAT TTATAGTAAT CCCACTTTCA AAAACACGCT TCGCTGCTTC 9660 

AGCATCTACC CAAATATTGA ATTCTGCTGT AGGCGTCCAA TTTCCAAATG TACCACCACC 9720 

CAT CAAAGTA ATAGATTCAA TATGCTCAGC GATTCTTGGC TCACGAATCA ATGCCGTTGC 9780 

TACATTCGTA AGAGGACCTG TCGCTACAAT TGTTACAGGT GTATCACTCG TCATCACTTT 9840 

GTTTATAATC ACATCTGATG CTGGCATTGC AACTGCTTGA CGTGATGGTG TCGACGGTAG 9900 

TTTCGGACCA TCTAATCCAG ATTCCCCATG TATTTCAGAA GCAAAGGCAG CTGGTTTAAT 9960 
TAACGGCCTA TCCGCACCTT TCGCTACTGC TATATCTTGG CGTCCCATAA TATCCAATAC . 10020 

GTTCAAGGCG TTTGTCGTAT TCTTGTCAAC TGATTGATTA CCTGCGACTG TTGTTACAGC 10080 

TAATATCTCT AGTGGACTGT CAATTGCCCC CGCTAAAATT AATGCTATTG CATCATCGTG 10140 

TCCTDGATCA CAATCCATAA TAATCTTTCT TTT CATTT AT ATATCCACCT TTCTTAAGTT 10200 

GTTATCGATA GCTTATGTAT ATTTATTTAT GTGGTGAATC ATGTTTATTT TGAAAAATAG 10260 

TTTTAACTTT CTCATATTTT TGGATACAAA CACTATTTAT CTATTTTATG GCTTATAAAT 10320 

TTATCCGATA TGCCTTATCA ACCTACCTCG CTAAAAATAG GATGTCT A CA TATCTATACC 103 80 

GACTTTTGTC AACTCATTTT CACAACAATA TAAAGAGCAA TTTATATGAT TGTTACATGA 10440 

TTCAAACAAT TTTTATGAAA AATATTTTCA TACACAGAAT ATATATTGAT ATTAAATTTC 10500 

TCAAAAGCTA TATTGAGAAT AATTAGGAGG GATGTTGATG AAATCTTTAT TTGAAAAAGC 10560 

ACAGCAGTTC GGCAAGTCCT TTATGTTACC TATCGCAATC TTACCAGCTG CAGGTCTATT 10620 

GTTGGGTATC GGTGGTGCAT TAAGTAATCC AAACACCGTT AAAGCATACC CTATTTTAGA 106 80 
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AAATTTACCG 


GTCATCTTTG 


CAATTGGTGT 


CGCAATCGGA 


TTATCTAGAA 


GCGATAAAGG 


10800 




TACTGCAGGT 


tTAGctGCGC 


TGCTCGGTTT 


CTTAATTATG 


AACGCAACTA 


TGAATGGCTT 


10860 


5 


ATTAACTATC 


ACGGGCACAT 


TGGCAAAAGA 


TCAGCTTGCA 


CAAAATGGAC 


AAGGCATGGT 


10920 




GCTCGGTATA 


CAAACGGTTG 


AAACCGGTGT 


TTTTGGCGGG 


ATTATCACAG 


GTATTATGAC 


10980 


10 


CGCAATACTT 


CACAACAAAT 


ATCACAAAGT 


GGTATTACCA 


CCGTATTTAG 


GTTTCTTTGG 


11040 


TGGCTCTAQA 


TTTGTCCCTA 


TTGTCACAGC 


ATTTGCCGCA 


ATCTTTTTAG 


GTGTATTGAT 


11100 




GTTTTTCATT 


TGGCCAAGCA 


TACAAGCCGG 


CATTTATCAT 


GTTGGTGGAT 


TTGTAACGAA 


11160 


15 


AACAGGTGCC 


ATCGGTACTT 


TTGTTTATGG 


CTTCATCTTA 


AGATTGTTAG 


GTCCACTCGG 


11220 




TTTACACCAT 


ATTTTTTACT 


TACCGTTTTG 


GGAGACGGCA 


CTTGGTGGTA 


CTTTAGAAGT 


11280 




CAAAGGGCAC 


TTAGTTCAAG 


GTACGCAGAA 


CATCTTCTTT 


GCTCAACTTG 


GTGATCCAGA 


11340 


SO 


TGTGAOGAAG 


TATTATTCAG 


GTGTGTCACG 


CTTTATGTCA 


GGCCGTTTTA 


TTACGATGAT 


11400 




GTTCGGCTTA 


TGTGGTGCCG 


CACTTGCAAT 


TTATCACACA 


GCTAAACCTG 


AACATAAAAA 


11460 




AGTTGTCGGC 


GGTTTAATGT 


TATCCGCTGC 


ACTCACTTCA 


TTTTTAACAG 


GTATTACCGA 


11520 


25 


ACCTTTAGAG 


TTTAGTTTCT 


TGTTTGTCGC 


ACCTATTCTT 


TATGTAATCC 


ATGCCTTCTT 


11580 




TGATGGATTA 


GCATTTATGA 


TGGCAGACAT 


TTTCAACATT 


ACAATTGGTC 


AAACCTTCAG 


11640 




TGGAGGCTTT 


ATCGATTTCT 


TACTCTTTGG 


TGTGCTACAA 


GGTAATAGTA 


AAACAAACTA 


11700 


30 


CCTATACGTC 


AT AC CT ATTG 


GAATTGTGTG 


GTTCTGTTTG 


TATTACATCG 


TTTTCAGATT 


11760 




CTTAATTACG 


AAATTTAATT 


TCAAAACACC 


TGGTCGAGAA 


GATAAAGCTG 


CAGCACAACA 


11820 


35 


AGTTGAGGCT 


ACTGAAAGAG 


CACAAACTAT 


TGTTGCTGGT 


TTGGGAGGCA 


AAGATAACAT 


11880 


TGAAATCGTT 


GACTGTTGTG 


CAACGAGACT 


ACGCGTCACA 


CTTCATCAAA 


ATGACAAAGT 


11940 




CGATAAAGTA 


TTACTCGAAA 


GTACTGGTGC 


CAAAGGTGTA 


ATCCAGCAAG 


GCACTGGTGT 


12000 


40 


GCAAGTAATT 


TATGGGCCTC 


ACGTTACAGT 


TATCAAAAAT 


GAAATTGAAG 


AATTGCTCGG 


12060 




GGATTAAGAC 


TAACCGAAAT 


ATCAACAGAA 


CTAATGGCAA 


CGATGTACGA 


AGTAAGAAGT 


12120 




GACATCGTTG 


CTTTTATTTT 


TAATGTTACA 


TTTGAAGCAT 


TAAGTTCATC 


ATGCACTGTA 


12180 


45 


GTGAGCCCGC 


AAATCGCCTC 


TGCTAGACAA 


TCATCTTAAT 


G CT ATGATT A 


AAGCTTAAGT 


12240 




GCCAGATTTG 


AATTTAATTT 


CAACAACGAC 


TTTCACTACA 


TTAAAAATAG 


GGCCACTCGA 


12300 




CACATATAGT 


TGTATCAAAT 


AGCCCTTTAT 


ACAATTTTTT 


GGGTAAGGTT 


TTACAATTTT 


12360 


50 


TGGGATGGTA 


TAGATTTTAT 


AAAAAGTTAT 


TTAAGTTCTT 


CTGCTTCAGC 


CAT AAT AT CT 


12420 




TTTAATGTTT 


TAG CTGAATG 


TGCGAACTTG 


CTTTGTTCTT 


CGTCGTTTAA 


TGGGATTTCT 


12480 
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TCCTCATATT CGCCTTCTAA TAATGCTGAT ACAGTCAATA CGGCATCTTC ATTTCTGAAA 12600 

ATCGCTTCAG TAATTCTAGC TAATCCCATT GCAACACCAT AATAAGTGGC ACCTTTAGCT 12660 

TGAATAATGT CATATGCTGC ATCACGTGTT TGAACAAAAA TTTGTTCAAT TTGCGCTTTG 12720 

CCCTCAGGAC GTTGTTCAAG TAATGTCTTC AAAGGTTGAC CCG CAATATT AGCGTGTGAC 12780 

CATACTGGTA ATTCAGTGTC ACCATGTTCA CCAATAATTT GAGCATCGAC GCTACGTGGC 12840 

GCAACATCGn AcgyTcGCTT AACAATAATC TAAAGCGTGC AGAGTCTAAA ATTGTAC CAG 12900 

AACCTATAAC ACGTTCTTTA GGTAAACCAG AGAATTTCCA TGTTGCATAC GCTAAAATAT 12960 

CAACAGGATT TGTAGCTACC AAGAAAATAC CATCAAATTT TGATGCCATT ACTTCACCAA 13 020 

CAATTGATTT GAATATTTTC AAGTTTTTAG ATACTAAATC TAAACGTGTT TCTCCAGGTT 13080 

TTTGTGCAGC ACCAGCACAG ATGACAACTA GATCCGCATC ATGACAATCA CTGTATTCGC 13140 

CAGCTTTCAC ACGAACTGTT GTTGGAGAAT ATGGTGTGGC ATGTTTTAAA TCCATAACAT 13200 

CTCCTCGAAC TTTTTCAGTG TCTAAATCAA TGATGACTAA TTCATCAACA ATGCTTTGGT 13260 

TCACTAATGA AAATGCGTAG CTTGAACCTA CTGCACCATT ACCTATTAAT ACAACTTTGT 13320 

TCCCTTTAAA TTTGTTCATT ACAAAAACTC CCTTATGATT AATTCACTAA CATACATGTA 13380 

GCTTCAAATA TGTTAGTTTA ATGCTGCTTA TTGACGATAC AAAAGCAAAT AAACATCTCT 13440 

TTTATTTTCA ACG CATAACT TAAAAGGTCA TGTGTCATCC GCTTTTAAGT TTGTGATTTA 135 00 

TTTCACATAT AAAATGTAAC ATGCATTAAG TACTGGGTCA ATATTAAATT GTGATTTATT 13560 

TCACATTTTA TTTTAATTTT TAGACCTTTT TAATTTGTAT mCGATTAGAT CTTAGATGTC 13620 

TTTAGTCTTC GTACTTCGCC AGTGATTATT TACACTTTCA CATTTTTATT ATCATGTTTA 13680 

CTTTTTTCTA GGAAAACAAC AATGTTTTTT GAATTAGTCA AATAAATGCG CTCAATCGTC 13740 

GGTGTGCAAA CAGACAATTG TACACAATGC TTATTGATAA GTATTTAAAA AATTAAAAAT 13800 

GTCATACAAT TATCAAATTT GCCATTTTAT TTATATTTTC TCAAACCAAT TAATTGAATA 13860 

TCGAAATTTT TAGTAGAATA ATCAAAATAT ACAGATTAAA GGAGGAGTAT CATGCTTACA 13920 

GAACAAGAGA AAGACATTAT CAAACAAACG GTGCCTTTAC TTAAAGAGAA AGGGACAGAA 13980 

ATTACGTCAA TCTTTTATCC AAAAATGTTT AAAGCGCATC CTGAACTTTT AAACATGTTT 14040 

AATCAAACGA ACCAAAAACG AGGCATGCAA TCTTCAGCAT TAGCACAAGC TGTAATGGCC 14100 

GCAGCGGTTA ATATCGATAA CTTAAGTGTT ATTAAACCAG TCATTATGCC AGTCGCATAT 14160 

AAACACTGCG CACTACAAGT TTATGCTGAA CATTATCCAA TTGTGGGGAA AAATTTATTA 14220 

AAAGCCATTC AAGACGTGAC AGGATTAGAA G AAAATG AC C CTGTCATTCA AGCTTGGGCA 14280 
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(2) INFORMATION FOR SEQ ID NO: 58: 

(i) SEQUENCE CHARACTERISTICS: 
5 (A) LENGTH: 8779 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

10 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 58: 

GGTATTTTnG GAaGGGTACC TAAAGCAATT CCGGCAAAGG GTnAAT CCAG GTACCGAAAT 60 

15 GGACTTCCCG TTATCGATAA TACCGACATA TATTGTGACA AGTAGATTTT ATGGACATTT 120 

AGGCTTACTT TTACTTGTGA TAATTGCATG TATGTTTACT GGTATTTAtC CaTCaATACA 180 

TATCATTCAA TTATTGATAT ATGTACCGTT TTGTTTTTTC TTAACTGCCt CGGTGACGTT 240 

^0 ATTAACATCA ACACTCGGTG TGTTAGTTAG AGATACACAA ATGTTAATGC AAGCAATATT 3 00 

AAGAATATTA TTTTACTTTT CACCAATTTT GTGGCTACCA AAGAACCATG GTATCAGTGG 360 

TTTAATTCAT GAAATGATGA AATATAATCC AGTTTACTTT ATTGCTGAAT CATACCGTGC 420 

AGCAATTTTA TATCACGAAT GGTATTTCAT GGATCATTGG AAATTAATGT TATACAATTT 4 80 

CGGTATTGTT GCCATTTTCT TTGCAATTGG TGCGTACTTA CACATGAAAT ATAGAGATCA 540 

ATTTGCAGAC TTCTTGTAAT ATATTTATAT GACGAAACCC CGCTAACCAT TAATAAATGG 600 

AAGTGGGGTT CATTTTTGTT TATAATTTAA GTAAATAACA TATTAAGTTG GTGTATTATG 660 

AACGTTTTAA TAAAGAAATT TTATCATTTG GTAGTTCGAA TACTTTCTAA AATGATTACG 720 

CCTCAAGTGA TTGATAAACC GCATATCGTA TTTATGATGA CTTTTCCAGA AGATATTAAG 780 

CCTATCATCA AAGCATTAAA TAATTCGTCG TATCAGAAAA CTGTTTTAAC AACACCAAAA 840 

CAAG&GCCTT ATTTATCTGA ACTTAGCGAC GATGTTGATG TGATAGAAAT GACTAATCGA 900 

40 ACATTGGTAA AACAAATTAA GGCTTTGAAA AGCGCGCAGA TGATTATTAT CGATAATTAT 960 

TAC CTATTGC TAGGTGOATA TAATAAGACT TCTAATCAAC ACATTGTTCA AACGTGGCAT 1020 

GCAAGTGGTG CATTAAAAAA CTTTGGCTTA ACAGATCATC AAGTCGATGT GTCTGACAAG 1080 

45 GCAATGGTTC AGCAGTACCG TAAAGTTTAT CAAGCGACGG ATTTTTACTT AGTGGGTTGT 1140 

GAACAAATGT CACAATGTTT TAAACAGTCT TTAGGTGCAA CAGAAGAGCA AATGCTGTAT 1200 

TTTGGGCTTC CGAGAATTAA TAAATATTAC ACAGCTGATA GAGCAACGGT TAAGGCAGAG 1260 

50 

TTAAAGGATA AATATGGAAT TACAAATAAG TTGGTATTAT ATGTACCAAC ATATAGAGAA 13 20 

GATAAAGCAG ATAATAGGGC TATTGATAAA GCTTATTTTG AAAAATGTTT ACCAGGATAT 13 80 
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ATCGACACGT CTACATTAAT GCTAATGTCA GATATAATTA TTAGCGACTA TAGTTCGCTQ 1500 

CCAATAGAAG CTAGCTTGTT AGATATTCCA ACTATATTTT ATGTGTATGA TGAAGGAACA 1560 

5 TATGATCAGG TGAGAGGCCT GAATCAATTT TACAAAGCAA TACCGGATAG CTACAAAGTG 1620 

TATACTGAAG AAGATTTAAT AATGACGATA CAAGAAAAAG AACATCTATT AAGTCCGTTA 1680 

TTTAAAGATT GGCATAAGTA TAATACTGAT AAAAGTTTAC ATCAGCTCAC AGAATATATA 1740 

10 

GATAAGATGG TGACAAAATG AGGTTTACGA TAATCATACC TACATGTAAT AATGAGGCAA 1800 

CAATTCGACA ATTGTTAATA TCTATTGAGA GTAAAGAACA CTATAGAATC CTTTGTATTG 1860 

ATGGTGGTTC TACTGATCAA ACAATTCCTA TGATTGAACG GTTACAAAGA GAACTCAAGC 1920 

IS 

ATATTTCATT AATACAATTA CAAAATGCTT CGATAGCTAC GTGTATTAAT AAAGGTTTOA 1980 

TGGATATCAA AATGACAGAT CCACATGATA GTGACGCATT TATGGTCATA AAACCAACAT 2040 

20 CAATCGTATT GCCAGGTAAA TTAGATAGGT TAACTGCTGC TTTCAAAAAT AATGATAATA 2100 

TTGATATGGT AATAGGG CAG CGAGCTTACA ATTACCATGG TGAATGGAAA TTGAAAAGTG 2160 

CTGATGAGTT TATTAAAGAC AATCGAATCG TTACATTAAC GGAACAACCA GATTTGTTAT 2220 

25 CAATGATGTC TTTTGACGGA AAGTTATTCA GTGCTAAATT TGCTGAATTA CAGTGTGaOG 2280 

AAACTTTAGC TAACa CATAC AATCACGCAA TACTTGTCAA GGCGATGCAA AAAGCTACGG 234 0 

ATATACATTT AGTTTCACAG ATGATTGTCG GAGATAACGA TATAGATACA CATGCTACAA 24 00 

30 GTAACGATGA AGATTTTAAT AGATATATCA CAGAAATTAT GAAAATAAGA CAACGAGTCA 24 60 

TGGAAATGTT ACTATTACCT GAACAAAGGC TATTATATAG TGATATGGTT GAT CGTATTT 2520 

TATTCAATAA TTCATTAAAA TATTATATGA ACGAACACCC AGCAGTAACG CACACGACAA 2580 

35 

TTCAACTCGT AAAAGACTAT ATTATGTCTA TGCAGCATTC TGATTATGTA TCGCAAAACA 264 0 

TGTTTGACAT TATAAATACA GTTGAATTTA TTGGTGAGAA TTGGGATAGA GAAATATACG 270 0 

AATTGTGGCG ACAAACATTA ATTCAAGTGG GCATTAATAG GCCGACTTAT AAAAAATTCT 2760 * 

40 

TGATACAACT TAAAGGGAGA AAGTTTGCAC ATCGAACAAA ATCAATGTTA AAACGATAAC 2820 

GTGTACATTG ATGACCATAA ACTGCAATCC TATGATGTGA CAATATGAGG AGGATAACTT 2880 

45 AATGAAACGT GTAATAACAT ATGGCACATA TGACTTACTT CACTATGGTC AT AT CG AATT 2940 

GCTTCGTCGT GCAAGAGAGA TGGGCGATTA TTTAATAGTA GCATTATCAA CAGATGAATT 3000 

TAATCAAATT AAACATAAAA AATCTTATTA TGATTATGAA CAACGAAAAA TGATGCTTGa 3060 

SO ATCAATACGC TATGTCGATT TAGTCATTCC AGAAAAGGGC TGGGGACAAA AAGAAGACGA 312 0 

TGTCGAAAAA TTTGATGTAG ATGTTTTTGT TATGGGACAT GACTGGGAAG GTGAATTCGA 3180 

55 



448 



EP 0 786 519 A2 



10 



is 



20 



26 



30 



35 



40 



SO 



TAAAATCAAA CAAGAATTAT ATGGTAAAGA TGCTAAATAA ATTATATAGA ACTATCGATA 3300 

CTAAACGATA AATTAACTTA GGTTATTATA AAATAAATAT AAAACGGACA AGTTTCGCAG 3360 

CTTTATAATG TGCAACTTGT CCGTTTTTAG TATGTTTTAT TTTCTTTTTC TAAATAAACG 3420 

ATTGATTATC ATATGAACAA TAAGTGCTAA TCCAGCGACA AGGCATGTAC CACCAATGAT 3480 

AGTGAATAAT GGATGTTCTT CCCACATACT TTTAGCAACA GTATTTGCCT TTTGAATAAT 354 0 

TGGCTGATGA ACTTCTACAG TTGGAGGTCC ATAATCTTTA TTAATAAATT CTCTTGGATA 3600 

GTCCGCGTGT ACTTTACCAT CTTCGACTAC AAGTTTATAA TCTTTTTTAC TAAAATCACT 3660 

TGGTAAAACA TCGTAAAGAT CATTTTCAAC ATAATATTTC TTACCATTTA TCCTTTGCTC 3720 

ACCTTTAGAC AATATTTTTA CATATTTATA CTGATCAAAT GAGCGTTCCA TTAATGCATT 3780 

CCCCATCATA TTAOGTTGCT TCTCGCCACC AAGGTTTTTA TAGTCTCCTG CACCCATGAT 3840 

AACTTGATTA ATTCTAAATT TACCTOGTTT GGTAGTAATC GTATGGTTGT AATTTGCTGT 3900 

ATCACTTGAT CCAGTTTTTA AACCATCTGT ACCCGGCAAA CTCATTTTTG CACCTTCCAA 3 960 

TGAAAAGTTG AATGTGTAAT ACGTAACTGC ATGCGTTGTT GGTGCTAACT GCTTTGTAAA 4020 

GTCTAATATT TTAGGTGTCT CTTTAATCAC GTGTAAATCT AAAATGGCAT AGTCTCTAGC 4 080 

AGTCGTTACA GTACGTTCTT GGTCTTTATA CTTTGTTGGT GCAAATGTAC GTAATCTTGA 4140 

ATTTTCAGCA CCCGTTGGAT TGACGAAATG TGTATTTTTC ATTCCGATAG CTTTAGCTTT 4200 

GTTATTCATT AAATCAACGA AATCGCTGGT GTTTTTTGAA ACCTTCTTAG CTAAAATTAA 4 260 

TGCCGCGGCA TTACTAGAAT TAGATACTGT AATTTGTAAT AGGTCTGCGA TTGTCCATAC 4320 

TTGTCCAGGA TATAGTTTCG TATTACTCAA CTCAGGTAGT GTAGACATAA TATATTCTTT 4 3 80 

GTTCGTCATT GTGACTGTGT CATCAAGTGA AAGCTGCCCC TTATTTACAG CTTCCAATGT 4440 

TAAGTACATT GTCATTAATT TAGTCATAGA CGCTGGAtTC CACTTAGTAT CGATATTGTA 4500 

TTGATACAGT AATTGTCCAG TTTGACTTAC ATTAACAGCA CTCGTCGGTT CGTATGCAGC 4 560 

CGACAAACCT GCATAACCAT ATTGATTTGC TGCTTGTACA GGGGTTACGT CACTGTTAGT 4 620 

AGCTTGTGCA TATGGTGTCA TAATACTTAA TGTTAAACAT AAAATGATGA TAATAGATAT 4 680 

TAAATTTTTC ATAAAGCGTT AATCTT CCCT TTTCCAATTC TTAAATATTC CCTAAAAGCA 474 0 

ATGGTTATTC CTACTTACGG AAATCATTGC TAATTCACTT CACCTTAATT AAATTGTTGA 4 800 

AAATAAAGTT TTCTGCAGTT AATTTGAAAA ATAATGCAAA TATATTACGT GTGTAGCTAA 4 860 

AGGTGTTATA ATGTTTGTAC GAAGAGCAAA CTTACTCAAA AGCGATTAAT TTTCATGTTT 4 920 

TAATATAAAG ACTTTGAGAA GTTATTACAA AAAATGCAAT AGAAATATTC TAT CAT AT AA 4980 
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AAGTATATGA 


TAGAAATGCA 


TGTATCTATC 


TAAATGAATT 


AACTATAAAT 


TTCAAACAGA 


5100 




AGAGGTAAAA 


CTATGAAACG 


AGAAAATCCA 


TTGTTTTTCT 


TATTTAAAAA 


ACTATCATGG 


5160 


5 


CCAGTGGGTC 


TTATCGTTGC 


AGCTATCACT 


ATTTCATCAC 


TAGGGAGCTT 


AAGTGGACTA 


5220 




TTAGTGCCAC 


TGTTTACTGG 


ACGAATTOTA 


GATAAATTTT CCgTGAGCCA 


TAT CAATTGG 


5280 




AATCtAATCG 


CATTATTTGG 


TGGTATCTTT 


GTCATCAATG 


CTTTATTAAG 


CGGATTAGGT 


5340 


10 


TTATATTTAT 


TAAGTAAAAT 


TGGTGAAAAG 


ATTATTTATG 


CGATACGCTC 


AGTTTTATGG 


5400 




GAGCATATCA 


TACAATTAAA 


AATGCCATTC 


TTTGACAAAA 


ATGAAAGTGG 


TCAATTAATG 


5460 


15 


AGTCGATTAA 


CTGACGATAC 


GAAAGTGATA 


AATGAATTTA 


TTTCACAAAA 


GCTACCTmAC 


5520 


TTATTACCAT 


CAATCGTTAC 


ATtAGTTGGG 


TCACTAATCA 


TGTTATTTAT 


TTTAGATTGG 


S5B0 




AAAATGACAT 


TATTAACATT 


TATAACGATA 


CCGATATTCG 


TTTTaATTAT 


GATTCCTCTA 


5640 


20 


GGTCGTATTA 


TGCAAAAGAT 


ATCGACAAGT 


ACACAATCTG 


AAATTGCAAA 


CTTCAGTGGT 


5700 




TTGTTAGGGC 


GTGTCCTAAC 


TGAAATGCGT 


CTTGTTAAAA 


TATCAAATAC 


AGAGCGTCTT 


5760 




GAATTAGATA 


ATGCACATAA 


AAATTTGAAT 


GAAATATATA 


AATTAGGTTT 


AAAACAGGCT 


5820 


25 


AAAATTGCGG 


CAGTTGTACA 


ACCAATTTCA 


GGTATAGTTA 


TGTTGCTAAC 


AATTGCAATT 


5880 




ATTTTAGGTT 


TTGGTGCATT 


AGAAATTGCG 


ACTGGTGCAA 


TCACTGCAGG 


TACATTAATT 


5940 




GCAATGATAT 


TTTATGTTAT 


TCAGTTATCT 


ATG CCTTTAA 


TCAATCTTTC 


CACGTTAGTT 


6000 


30 


ACAGATTATA 


AAAAGGCAGT 


CGGTGCAAGT 


AGTAGAATAT 


ACGAAATCAT 


GCAAGAACCT 


6060 




ATTGAACCGA 


CAGAAG CTCT 


TGAAGATTCT 


GAAAATGTAT 


TAATTGATGA 


CGGTGTATTG _ 


6120 




TCATTTGAAC 


ATGTAGACTT 


TAAATATGAT 


GTGAAGAAAA 


TATTAGATGA 


TGTGTCGTTC 


6180 


35 


CAAATCCCAC 


AAGGTCAAGT 


GAGTGCTTTT 


GTAGGCCCTT 


CTGGGTCTGG 


TAAAAGTACG 


6240 




ATATTTAATC 


TGATAGAACG 


TATGTATGAA 


ATTGAGTCAG 


GTGATATTAA 


ATATGGCCTT 


6300 


40 


GAAAGTGTCT 


ATGATATCCC 


GTTATCTAAG 


TGGCGACGCA 


AAATTGGATA 


TGTTATGCAA 


6360 


TCAAATTCGA 


TGATGAGTGG 


TACAATTAGA 


GACAATATTT 


TATACGGAAT 


TAATCGTCAT 


6420 




GTTTCAGATG 


AAGAACTTAT 


TAATTATGCT 


AAATT AG CG A 


ACTGTCATGA 


TTTTATCATG 


6480 


45 


CAATTTGATG 


AAGGATATGA 


CACGCTTGTA 


GGTGAACGAG 


GATTGAAACT 


GTCTGGCGGA 


6540 




CAACGTCAAC 


GTATTGATAT 


TGCTAGAAGT 


TTTGTTAAAA 


ATCCTGATAT 


TTTGTTACTT 


6600 




GATGAAGCAA 


CAGCTAATCT 


CGATAGTGAA 


AGTGAATTGA 


AAATT CAAGA 


AGCTTTAGAA 


6660 


50 


ACATTGATGG. 


AAGGTAGAAC 


AACGATTGTC 


ATTG CGCATC 


GTTTGTCTAC 


AATTAAAAAA 


6720 




GCCGGTCAAA 


TTATATTCTT 


AGACAAAGGA 


CAGGTAACAG 


GTAAAGGTAC 


GCATTCAGAA 


6780 
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TTTTATATAT ATAAGTAAGC TTGGAGCAAA TACACATATA CCATCGAGGA AATTAAAGTG €900 

TGGCACATTG ATGGATATAG ATGTTAATAA ATTGCTTCAA GCTTTTGTCT ATTTTAAATC 6960 

5 ATTTGAGAAG TTACGACATA ATAATTCTTA AATTAATGAA ATCGATATTT TAAGAAAAAA 7020 

ATGCTCATGG TATAATACAA GTTATAAGCA AACATACATA TATTAAATAC TGTAGCCACG 7080 

AGTCATAATT CTTCATATTT TACATAGCAA TTTAACTGAT TTTAGAGTCC ACGGTACAGA 714 0 

10 

AGTTTGATAT TTCAATGTTT CTAAATTTTT AAAAAATTAA ATCATAGGTG GGTGCCAAAT 7200 

GTTTTTATTA ATCAACATTA TTGGTCTAAT TGTATTTCTT GGTATTGCGG TATTATTTTC 7260 

AAGAGATCGC AAAAATATCC AATGGCAATC AATTGGGATC TTAGTTGTTT TAAACCTGTT 7320 

1$ 

TTTAGCATGG TTCTTTATTT ATTTTGATTG GGGTCAAAAA GCAGTAAGAG GAGCAGCCAA 7380 

TGGTATCGCT TGGGTAGTTC AGTCAGCGCA TGCTGGTACA GGTTTTGCAT TTGCAAGTTT 7440 

2Q GACAAATGTT AAAATGATGG ATATGGCTGT TGCAGCCTTA TTCCCAATAT TATTAATAGT 7500 

GCCATTATTT GATATCTTAA TGTACTTTAA TATTTTACCG AAAATTATTG GAGGTATTGG 7560 

TTGGTTACTA GCTAAAGTAA CAAGACAACC TAAATTCGAG TCATTCTTTG GGATAGAAAT 7620 

2s GATGTTCTTA GGAAATACTG AAGCATTAGC CGTATCAAGT GAGCAACTAA AACGTATGAA 7680 

TGAAATGCGT GTATTAACAA TCGCAATGAT GTCAATGAGC TCTGTATCGG GAGCTATTGT 7740 

AGGTG CGTAT GTACAAATGG TACCAGGAGA ACTGGTACTA ACGGCAATTC CACTAAATAT 7800 

30 CGTTAACGCG ATTATTGTGT CATGCTTGTT GAATCCAGTA AGTGTTGAAG AGAAAGAAGA 7860 

TATTATTTAC AGTCTTAAAA ACAATGAAGT TGAACGTCAA CCATTCTTCT CATTCCTTGG 7920 

AGATTCTGTA TTAGCAGCAG GTAAATTAGT ATTAATCATC ATCGCATTTG TTATTAGTTT 7980 

35 

TGTAGCGTTA GCTGATCTAT TTGATCGTTT TATCAATTTG ATTACAGGAT TGATAGCAGG 8 040 

ATGdXTAGGC ATAAAAGGTA GTTTCGGTTT AAACCAAATT TTAGGTGTGT . TTATGTATCC 8100 

ATTTGCGCTA TTACTCGGTT TACCTTATGA TGAAGCGTGG TTGGTAG CAC AACAAATGGC 8160 

40 

TAAGAAAATT GTTACAAATG AATTTGTTGT TATGGGTGAA ATTTCTAAAG ATATTGCATC 8220 

TTATACACCA CACCATCGTG CGGTTATTAC AACATTCTTA ATTTCATTTG CAAACTTCTC 8280 

4S AACGATTGGT ATGATTATCG GTACATTGAA AGGCATTGTT GATAAAAAGA CATCAGACTT 8340 

TGTATCTAAA TATGTACCTA TGATGCTATT ATCAGGTATC CTAGTTTCAT TATTAACAGC 84 00 

AGCTTTCGTT GGTTTATTTG CATGGTAATA TGTCGAAGAG TGACTATGAT AATACATTTT 8460 

60 AACTAATAAA TATGTCCAGG CATGTCGTCT ATTGATATAG GTGAGATGCT TGGACTTTTT 8520 

TATTATTGAT ATAAAGGTAT nTAAATATTT TTAAAGTTAC CGAAATTGAA G CATT AT AAA 8580 
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GACAGTAAGG ACTAGGTACA GTCATAGTAC TTCGAGCAAA ATTTGTTTTG TTATTATAAA 8700 

CAACACAAAG GAGATAACTT CTCTAnTGAA GAAGTTAAAA ACATTATAGC AGACAATGAA 8760 

5 ATGAAAGTAA ATTAAAAAT 8779 

(2) INFORMATION FOR SEQ ID NO: 59: 

(i) SEQUENCE CHARACTERISTICS: 
10 (A) LENGTH: 31096 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
<D) TOPOLOGY: linear 



15 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 59: 





G TTG CAGT AG 








rtfF*iV2 c* Af^ A C* 


CCGAAAATGT 


60 


20 




a^u\jt/\xV7l»r\v 


OAPATAAAfiT 


AATTRTTfiAA 


AAAAATGCTG 


GCATTGGTTC 


120 




AuuAl J. 1 1L1 


a amaTtTnT 


A Tn A AAA AHA 


AGGCGCTAAG 


ATCGTAACTC 


ACGAACAAGC 


180 






ATTfTTCPTA 
w\i vi i vi x n 


TCAAAGTAAA 


AGAACCTCAT 


GAAAGCGAAT 


ATCAATATTT 


240 


25 


r*A& aaa^aat 




GGGOATTTTT 

vJvJ\Jw X X X X A 


ACATCTAGCA 


TCTTCAAAAG 


AAATAGTAGA 


300 




AAAAATGCAA 


GAAGTTGGTG 


TAACTGCGAT 


TAGTGGTGAA 


AC CATTAT AA 


AAAATGGAAA 


360 




AG CAGAATT A 


TTAGCGCCAA 


TGAGTGCTAT 


AGCAGGTCAA 


CGCTCAGCAA 


TTATGGGAGC 


420 


30 


TTACTACTCT 


GAAGCACAAC 


ATGGTGGTCA 


AGGTACTTTA 


GTGACTGGTG 


TACATGAAAA 


480 




TGTGGATATA 


CCTGGTAGTA 


CATATGTGAT 


TTTCGGTGGT 


GGAGTAGCAG 


CAACAAATGC 


540 


35 


AGCAAATGTT 


GCCTTGGGAC 


TAAATGCTAA 


AGTAATCATT 


ATCGAGTTAA 


ACGATGACCG 


600 


CATTAAATAT 


CTTGAAGATA 


TGTATGCAGA 


AAAAGATGTC 


ACAGTAGTCA 


AATCAACACC 


660 




AGAftAATTTA 


GCAGAACAAA 


TTAAGAAAGC 


AGATGTATTT 


ATTTCTACAA 


TTTTAATTTC 


720 


40 


AGGTGCGAAA 


CCGCCAAAAT 


TGGTTACTCG 


TGAGATGGTT 


AAATCAATGA 


AAAAAGGTTC 


780 


AGTATTAATC 


GATATAGCTA 


TTG AC CAAGG 


TGGAACTATT 


GAAACAATTA 


GACCAACTAC 


840 




AATTTCTGAT 


CCAGTGTATG 


AAGAAGAAGG 


TGTGATTCAT 


TATGGTGTAC 


CAAATCAACC 


900 


45 


AGGAGCAGTC 


CCAAGAACTT 


CAACAATGGC 


ATTAGCACAA 


GGAAATATTG 


ATTATATATT 


960 




AGAAATTTGT 


GACAAAGGCT 


TAGAACAAGC 


AATTAAAGAT 


AATGAAGCCT 


TAAGTACTGG 


1020 




TGTAAACATT 


TACCAAGGAC 


AAGTGACAAA 


T CAAGG ATT A 


GCTTCATCAC 


ATGACCTAGA 


1080 


SO 


TTATAAAGAA 


ATATTAAATG 


TTATCGAATA 


GATAGTAATT 


TAAATGAAAT 


TGAGTGAAAT 


1140 




GAATATTTTA 


AATATAGCAT 


TATAGTTTGG 


ACTAAAAATT 


TACAAAACGG 


AAGGATGTAA 


1200 
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TCGAAGAAGC TAAAGCAAGC 


! ATTAAACCAT 


TTATTCGTCG AACACCTCTA ATTAAATCAA 






TGTATTTAAG CCAAAGTATA ACTAAAGGGA ATGTATTTCT AAAATTAGAA AATATGCAAT 


1 ion 


5 


TCACAGGATC TTTTAAATTT 


AGAGGCGCTA 


gCAATnAAAA TTAATCACTT AACAGATGAA 






CAAAAAGAAA AAGGCATTAT 


CGCAGCATCT 


GCTGGGgAAC 


CATGCACAAG GTGTTGCTTT 






AACAGCTAAA TTATTAGGCA 


TTGATGCAAC 


GATTGTAATG 


CCTGAAACAG CACCACAAGC 


IjDU 


10 


GAAACAACAA GCAACAAAAG 


GCTATGGGGC 


AAAGGTTATT 


TTAAAAGGTA AAAACTTTAA 


XOZu 




CGAAACTAGA CTTTATATGG 


AAGAATTAGC 


GAAAGAAAAT 


GGCATGACAA TCGTTCATCC 


1 Con 


15 


ATATGACGAT AAGTTTGTAA 


TGGCAGGCCA 


AGGAACAATT 


GGTTTAGAAA TTTTAGATGA 


1740 


TATTTGGAAT GTGAATACAG 


TCATCGTACC 


AGTTGGCGGT 


GGAGGA1TAA TTGCAGGTAT 


1800 




TGCCACCGCA TTAAAATCAT 


TTAACCCTTC 


AATTCATATT 


ATCGGTGTTC AATCTGAGAA 


1860 


20 


TGTTCATGGT ATGGCTGAGT 


CTTTCTATAA 


GAGAGATTTA 


ACTGAACATC GAGTC3GATAO 


1920 




CACAATAGCA GATGGTTGTG 


ATGTAAAAGT 


TCCTGGTGAA 


CAAACATATG AAGTAGTTAA 


I960 




ACATTTAGTA GATGAATTTA 


TTCTTGTTAC 


TGAAGAAGAA 


ATTGAACATG CTATGAAAGA 


2040 


25 


TTTAATGCAG CGTGCCAAAA 


TTATTACTGA 


AGGTGCAGGC 


GCATTACCAA CAGCTGCAAT 


2100 




TTTAAGTGGA AAAATAAACA 


ATAAATGGCT 


TGAAGATAAA 


AATGTTGTTG CATTAGTTTC 


2160 




AGGCGGGAAT GTTGACTTAA 


CTAGAGTTTC 


AGGTGTCATT 


GAACATGGAC TGAATATTGC 


2220 


30 


AGATACAAGC AAGGGTGTGG 


TAGGTTAAAA 


CATTTAATCT 


TAAAAATGAG GTGTAATTAT 


2280 




GTCAAATGGT AAAGAATTAC 


AAAAAAATAT 


AGGTTTCTTC 


TCAGCGTTTG CTATTG TTAT 


2340 




GGGGACAGTT ATTGGTTCAG 


GAGTATTCTT 


TAAAATATCA AACGTAACAG AAGTAACAGG 


2400 


35 


AACAG CAGG A ATGGCCTTGT 


TTGTATGGTT 


CCTAGGCGGC ATCATTACCA: TTTGTGCGGG 


2460 




GTTAACAGCA GCAGAACTTG 


CTGCTGCAAT 


CCCTGAAACA 


GGTGG CTTAA CGAAGTATAT 


2520 


40 


AGAATATACA TACGGTGATT 


TCTGGGGCTT 


CCTATCAGGT 


TGGGCG CAAT CATTTATTTA 




TTTTCCAGCT AACGTAGCAG 


CATTGTCTAT 


CGTATTTGCG 


ACACAGCTAA TTAATTTATT 






CCATTTATCT ATAGGTTCGT 


TAATACCAAT 


AGCAATCGCA 


TCTGCGTTAT CTATTGTGTT 


^ /UU 


45 


GATAAATTTC CTAGGTTCAA 


AAGCAGGCGG 


AATTTTACAA 


TCAGTTACTT TAGTAATTAA 


2760 




ACTGATTCCA ATCAT CGTTA 


TTGTAATTTT 


TGGTATTTTT 


CAATCTGGAG ATATCACTTT 


2820 




TTCATTAATT CCAACTACAG 


GTAATTCaGG 


AAATGGCTTC 


TTTACAGCAA TTGGTAGTGG 


2880 


SO 


TTTATTAGCA ACTATGTTTG 


CATATGATGG 


TTGGATTCAT 


GTAGGAAATG TTGCGGGGGA 


2940 




ACTTAAAAAT CCTAAACGCG 


ATTTACCTTT 


AGCGATTTCA 


GTTGGTATCG GTTGTATTAT 


3000 
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TGGTAATTTA 


AATGCAGCTT 


CAGATACATC 


AAAAATATTA 


TTTGGTGAAA 


ATGGCGGTAA 


3120 




GATTATTACA 


ATCGGTATAT 


TAATTTCTGT 


TTATGGTACG 


ATCAATGGCT 


ATACTATGAC 


3180 


5 


TGGTATGCGC 


GTACCATATG 


CAATGGCTGA 


AAGAAAATTA 


TTGCCATTTA 


GCCATTTATT 


3240 




CGCAAAATTA 


ACAAAATCTG 


GCGCACCATG 


GTTTGGCGCA 


ATTATACAAC 


TTATAATCGC 


3300 




TATCATCATG 


ATGTCAATGG 


GAGCATTTGA 


TACAATTACA 


AATATGTTAA 


TCTTTGTTAT 


3360 


10 


TTGGTTGTTC 


TATTGTATGT 


CATTTGTTGC 


GGTAATAATT 


TTAAGAAAAC 


GTGAACCAAA 


3420 




TATGGAACGA 


CCATATAAAG 


TACCGTTATA 


TCCGATCATA 


CCTTTAATTG 


CTATTTTGGC 


3430 


15 


AGGATCATTT 


GTATTAATTA 


ATACACTGTT 


TACACAATTT 


ATATTAGCAA 


TCATTGGAAT 


3540 


TCTAATAACA 


GCACTTGGTA 


TACCAGTTTA 


TTACTATAAA 


AAGAAACAAA 


AAGCAGCATA 


3600 




AGGTAAGATA 


ACT AG CATTG 


AGAATAAATG 


GATGGACTAC 


TAATAAATTT 


AAAGTTTTAC 


3660 


20 


ACATTAAAAT 


CAAAAACCAT 


TCAATTATTC 


TATGGAACAG 


ACAAATTTCT 


GTTATGGAAT 


3720 




TTGTCTGTTT 


TTCAAAAGTA 


TAGGGAGGCA 


AATAGAGATG 


GAAAAGCCGT 


CAAGAGAGGC 


3780 




ATTTGAAGGC 


AATAATAAGT 


TGTTAATAGG 


AATTGTTCTA 


AGTGTAATAA 


CGTTTTGGCT 


3840 


25 


ATTTGCACAA 


TCATTGGTTA 


ATGTTGTACC 


AATACTTGAA 


GATAGTTTCA 


ATACAGATAT 


3900 




TGGAACGGTT 


AATATCGCCG 


TTAGTATAAC 


TGCTTTATTT 


TCAGGAATGT 


TTGTAGTAGG 


3960 




AGCAGGTGGT 


CTTGCTGATA 


AATATGGCAG 


AATTAAACTC 


ACGAACATTG 


GTATTATCTT 


4020 


30 


AAATATATTA 


GGTTCATTAT 


TAATCATTAT 


TTCAAATATT 


CCTTTATTAC 


TTATTATAGG 


4080 




AAGATTAATT 


CAAGGACTTT 


CAGCAGCATG 


TATTATGCCT 


GCAACTTTGT 


CTATTATTAA 


4140 




GTCATATTAC 


ATTGGGAAAG 


ATAGACAACG 


CG CTTTAAGT 


TATTGGTCAA 


TTGGCTCATG 


4200 


35 


GGGCGGCTCT 


GGTGTTTGTT 


CATTTTTTGG 


AGGTG CAGTT 


GCAACGCTTT 


TAGGTTGGCG 


4260 




TTGGATTTTC 


AT CCTATCAA 


TTATAATTTC 


ATTAATTGCA 


CTGTTTCTTA 


TTAAAGGCAC 


4320 


40 


ACCTGAAACT 


AAATCTAAAT 


CGATTTCTCT 


AAATAAATTT 


GACATTAAAG 


GTCTGGTTCT 


4380 


TTTAGTCATT 


ATGCTCCTCA 


GTTTAAATAT 


TTTAATTACT 


AAAGGATCAG 


AATTAGGTGT 


4440 




AACCTCACTT 


CTTTTTATTA 


CTTTATTAGC 


TATTGCAATT 


GGATCTTTTA 


GTTTATTTAT 


4500 


45 


AGTTCTTGAA 


AAGCGTGCTA 


CAAATCCTTT 


AATCGATTTT 


AAATTATTTA 


AAAATAAAGC 


4560 




TTACACAGGT 


GCAACAGCTT 


CAAACTTTTT 


GTTAAATGGT 


GTTGCAGGAA 


CATTAATAGT 


4620 




AGCCAACACA 


TTTGTTCAAA 


GAGGTTTAGG 


ATATTCTTCA 


TTGCAAGCAG 


GAAGTTTATC 


4680 


60 


AATCACTTAT 


TTAGTAATGG 


TACTAATTAT 


GATTCGTGTT 


GGTGAAAAGT 


TACTTCAAAC 


4740 




ACTCGGATGC 


AAGAAACCAA 


TGTTAATTGG 


AACAGGAGTT 


CTTATTGTCG 


GAGAATGTCT 


4800 
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10 



15 



ATTCTTTGGT TTAGGACTAG GGATATATGC TACACCATCA ACAGATACAG CAATTGCAAA 4920 

TGCACCGTTA GAAAAAGTAG GCGTTGCTGC AGGTATCTAT AAAATGGCTT CTGCATTAGG 4980 

TGGAGCATTT GGCGTCGCAT TGAGTGGTGC AGTATATGCA ATCGTATCAA ATATGaCAAA 5040 

CATTTATACA GGTGcAATGa TTGnCATTAT GGTTaAATGC AGGTATGGGa ATATTATCaT 5100 

TCGTTATCAT TTTGtTACTT GTGcCTAAAC mAAACGACAC TCAATTATGA TAATTGAGAA 5160 

TTAAATTGAA ATCATACAAG TCGCTACAAT ATTAAACAAA AAT ATAAAC C GATTCTTATG 5220 

TGTCATTATT TTAAATGAAC ATAGGGATTG GTTTTTTATT ACTCTTTTAC GCTACTTTAT 5280 

TTATAATTAT TATAAATTGT CACAAATTCA ATTTACCTTA CAATATATTT TGTGTTATTA 5340 

TATTCTGGAG CATAAATAAA TTGTTCAACA CATAGTTGTA ATGTGTTTCA ATACTTTTTG 5400 

GATAGATTGC GAAATTGTAT TGAATCGTCA TCGTTTTAAA TTTTTAAATG AGAATGGAAT 5460 

20 GAGCATTACA ATACACAAGC AATCAAAAGT AAATACATTC ACAACACAAC AGAGACATAA 5520 

CAACAAGATA AGGAGTGAAC AATAGCTGTG AATTATCGTG ATAAAATTCA AAAGTTTAGT 5580 

ATT CGTAAAT ATACAGTTGG TACATTTTCA ACTGTCATTG CGACATTGGT ATTTTTAGGA 5640 

26 TTCAATACAT CACAAGCACA TGCTGCTGAA ACAAATCAAC CAGCAAGCGT GGTTAAACAG 5700 

AAACAACAAA GTAATAATGA ACAGACTGAG AATCGAGAAT CTCAAGTACA AAATTCTCAA 5760 

AATTCACAAA ATGGTCAATC ATTATCTGCT ACTCATGAAA ATGAGCAACC AAATATTAGT 5820 

CAAGCTAATT TAGTAGATCA AAAAGTAGCG CAATCATCTA CTACTAATGA TGAACAACCA 5880 

GCATCTCAAA ATGTAAATAC AAAGAAAGAT TCGGCAACGG CTGCGACAAC ACAACCAGAT 5940 

AAAGAACAAA GTAAGCATAA ACAAAACGAA AGTCAATCTG CTAATAAAAA TGGAAACGAC 6000 

AATAGAGCGG CTCATGTAGA AAATCATGAA GCAAATGTAG TAACAGCTTC AGATT CATCT 6060 

GATAATGGTA ACGTACAACA TGACCGAAAT GAATTACAAG CGTTTTTTGA TGCAAATTAT 6120 

CATGATTATC GCTTTATTGA CCGTGAAAAT GCAGATTCTG GCACATTTAA CTATGTAAAA 6180 

GGCATTTTTG ATAAGATTAA TACGTTATTA GGCAGTAATG ATCCAATAAA CAATAAAGAC 6240 

TTGCAACTTG CATACAAAGA ATTGGAACAA GCTGTTGCTT TAATTOGTAC AATGCCTCAA 6300 

45 CGTCAACAGA CTAGCCGACG TTCAAATAGA ATTCAAACGC GTTCGGTTGA GTCAAGAGCT 6360 

GCAG AG CCTA GATCAGTATC AGACTATCAA AATGCAAATT CATCATATTA TGTTGAAAAT 64 20 

GCTAATGATG GTTCGGGCTA TCCTGTTGGT ACATATATCa ATG CTTCTAG TAAAGGGGCG 6480 

60 CCATATAATT TACCAACTAC ACCATGGAAT ACATTGAAGG CCTCTGACTC AAAGGAAATT 654 0 

GCTCTTATGA CAGCGAAACA AACTGGAGAC GGGTACCAAT GGGTTATTAA GTTTAATAAA 6600 



55 



30 



35 



40 
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GTAGGAAGAA CTGACTTTGT AACAGTTAAT TCAGATGQAA CAAATQTACA ATGGAGTCAT 6720 

GGAGCAGGAG CAGGTGCAAA TAAACCACTT CAACAAATGT GGGAATATGG AGTAAATGAT 6780 

5 CCTCATCGTT CACATGACTT TAAAATAAGA AATAGAAGTG GCCAAGTAAT ATATGACTGG 684 0 

CCAACTGTCC ATATTTATTC TTTAGAAGAT TTATCTAGAG CX3AGTGATTA TTTTAGTGAA 6900 

GCTGGAGCGA CACCTGCTAC TAAAGCTTTT GGTAGACAAA ATTTTGAATA TATTAATGGT 6960 

10 CAAAAACCTG CTGAATCACC GGGTGTTCCT AAAGTTTATA CTTTCATCGG TCAAGGTGAT 7020 

GCAAGTTATA CAATTTCATT TAAAACACAA GGTCCAACTG TTAATAAATT GTACTATGCA 7080 

GCAGGTGGGC GTGCTTTAGA GTACAATCAA TTATTTATGT ACAGTCAACT ATACGTCGAA 7140 

15 

TCAACGCAAG ACCATCAACA ACGTCTTAAT GGTTTAAGAC AAGTGGTTAA TCGTACATAT 7200 

CGCATAGGTA CAACTAAACG TGTAGAAGTG AOTCAAGGAA ATGTACAAAC GAAAAAGGTA 7260 

TTAGAAAGTA CAAACCTAAA TATAGATGAT TTTGTTGATG ATC CTTTAAG TTATGTTAAG 7320 

20 

ACGCCGAGTA ATAAAGTGTT AGGATTTTAT TCGAATAATG CAAATACTAA TGCTTTTAGA 7380 

CCGGGTGGAG CCCAACAATT AAATGAATAT CAATTAAGTC AATTATTTAC TGATCAAAAA 7440 

2S TTACAAGAAG CAGCAAGAAC TAGAAACCCA ATAAGATTAA TGATTGGTTT CGACTATCCT 7500 

GATGCTTATG GTAATAGTGA AcTTTAGTTC CTGTTAACTT AACGGTATTA CCTGAAATCC 7560 

AACATAATAt TaAATTCTTT AAAAATGACG ATACTCAAAA TATTGCTGAA AAACCATTTT 7620 

30 CAAAACAAGC TGGGCATCCA GTTTTCTATG TATATGCAGG TAACCAAGGG AATGCTTCCG 7680 

TGAATTTAGG TGGTAGCGTA ACATCTATTC AACCATTACG TATTAATTTA ACAAGTAATG 774 0 

AGAATTTTAC AGATAAAGAT TGGCAAATTA CAGGTATTCC GCGTACATTA CACATTGAAA 7800 

55 ACTCGACAAA TAGACCTAAT AATGCCAGAG AACGCAATAT TGAACTTGTT GGTAACTTAT 7860 

TACC&GGGGA TTACTTTGGA ACGATACGTT TTGGACGTAA AGAACAATTA TTCGAAATTC 792 0 

GTGTTAAACC ACATACACCA ACAATTACAA CGACAGCTGA GCAATTAAGA GGTACAGCAT 7980 

40 

TACAAAAAGT GCCTGTTAAT ATTTCGGGAA TACCGTTGGA TCCATCGGCA TTGGTTTATT B04 0 

TAGTTGCACC AACAAATCAA ACTACGAATG GTGGTAGTGA GGCAGATCAA ATACCATCTG 8100 

GTTATACGAT ACTTGCGACT GGTACACCTG ATGGGGTGCA TAATACAATT ACTATACGAC 8160 

45 

CGCAAGATTA TGTTGTATTC ATACCACCTG TAGGTAAACA AATTAGAGCA GTAGTTTATT 8220 

ATAATAAAGT AGTTGCATCT AATATGAGTA ATGCTGTTAC TATTTTGCCA GATGACATTC 8280 

so CACCAACAAT CAATAATCCT GTTGGAATAA ATGCCAAATA CTATCGAGGC GACGAAkCAA 8340 

CTTTACAATG GGTGTCTCTG ATAGACATTC TGGTATAAAA AATACAACTA TTACGACATT 8400 
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TACAGGTAGA 


GTGAGTATGA ATCAGGCATT 


+J%£\\~J\\J 1 VJXt 1 


nil nV^i 111a 


AAV? 1 v» l VmAuL 


8520 




GACAGaCAAT 


GTCAATAATA 


CGACAAATGA 




aaar*aTY2TTT 

nnnUi lul 1 1 


ani'p ft htv^t* 

V— rVM 1 1 IviilVji. 


8580 


5 


AGGTAAAATT 


AGTGAAGATG 


CTCATCCGAT 


TOT ATTACH a 


aaTatTrtarsa 


/W\V> 1 1 VJ 1 JVk3 1 


e c a n 
Oo4U 




AGTCAATCCG 


ACTGCTGTAT 


CTAATGATGA 


aaanpaaarsr* 
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/^^"p^n^n ft 'p^i ft ft 
1 1 lAluAA 


8700 


10 


TAAAAACCAA 


AATATAAGAG 
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a»rph nrTniT 


CCAV? lAAv, 1 Vj 


*Prf*VftTft ft *P ft ft 

TCXaATAATAA 


8760 


X ww X/V\ X v X V* 


ACATTACATT 


ACCGTGATGG 


p*pr< ft T/*Y2 ft O ft 
L. 1 L/Vl t-\iA\JA 


ALaJL. 1 IviA 1\j 


/'W !» TV ^ft ft ft fyvyf M 

CTACAAATGT 


8820 




fi a TY^a fa th r* 

un X unUl 1 nV. 


GAACCAGTTG 


TGAAACCTGA 


ATACCAAACT 


GTCAATGCTG 


CTAAAACAGC 


8860 


1$ 




ATTGCTAAAG 


GACAATCATT 


TAGTATTGGT 


^1 A m TV >TW *\ IV IV /"I 

GATATTAAAC 


AATATTTTAC 


8940 


TTTAAGTAAT 


GGACAACCTA 


TTCCAAGTGG 


CACATTTACA 


AATATTACAT 


CTGATAGAAC 


9000 




^ TV ^^/**^1TV « /Hi || 

TAXTCCAACT 


GCACAAGAAG 


TTAGTCAAAT 


GAACGCAGGC 


ACGCAGTTAT 


ACCATATAAC 


9060 


20 


TGCTACAAAT 


GCGTATCATA 


AAGATAGTGA 


AGACTTCTAT 


ATTAGTTTGA 


AAATCATOGA 


9120 




TGTGAAACAA 


CCAGAAGGCG 


ATCAACGTGT 


ATATCGTACA 


TCAACATATG 


ATTTAACTAC 


9180 




TGATGAAATC 


TCAAAAGTAA 


AACAAGCATT 


TATTAATGCA 


AATAGAGATG 


TAATTACGCT 


9240 


25 


TGCCGAAGGT 


GATATTTCAG 


TTACAAATAC 


ACCTAATGGT 


GCTAATGTAA 


GTACTATTAC 


9300 




AGTAAATATT 


AATAAAGGTC 


GATTAACGAA 


ATCATTCGCG 


TCAAACCTAG 


CTAATATGAA 


9360 




TTTCTTGCGT 


TGGGTTAATT 


TCCCACAAGA 


TTATACAGTG 


ACATGGACGA 


ATGCAAAAAT 


9420 


30 


TGCAAACAGA 


CCAACAGATG 


G TGGTTT AT C 


ATGGTCTGAT 


GACCATAAAT 


CTTTAATTTA 


9480 




TCGTTATGAT 


GCTACATTAG 


GTACTCAAAT 


TACGACGAAT 


GATATTTTAA 


CAATGTTAAA 


9540 


35 


AGCAACAACT 


ACAGTGCCTG 


GATTGCGAAA 


TAACATTACT 


GGTAATGAAA 


AATCACAAGC 


9600 


AGAAGCTGGC 


GGAAGACCTA 


ACTTTAGAAC 


GACTGGTTAT ,: 


TCACAATCAA ATGCGACAAC 


9660 






CGTCAATTTA 


CX3TTGAATGG 


TCAAGTGATT 


CAAGTGTTAG 


ACATCATCAA 


9720 


40 




GGTTATGGTG 


GGCAACCTGT 


iALAAAl 1 (JA 


AATACTCGTG 


CAAAC CAT AG 


9780 




GTTGTTAACG 


TAAACGAACC 




GGTGcTGGCG 


CATTTACAAT 


9840 






a a a a^*r 2l 

vlnnnnnuln 


hi 1L 1ALALA 


1AA 1\jCLAAVj 1 


GATGCAGTTT 


ATAAAGCACA 


9900 


45 


GTTATACTTA 


ACGCCATATG 


GTCCAAAACA 


ATATGTTGAA 


CATTTAAATC 


AAAATACAGG 


9960 




AAATACTACT 


GACGCTATTA 


ACATTTATTT 


TGTACCAAGT 


GACTTAGTGA 


ATCCAACAAT 


10020 




TTCAGTAGGT 


AATTACACTA 


ATCATCAAGT 


GTTCTCAGGT 


GAAACATTTA 


CAAATACTAT 


10080 


SO 


TACAGCGAAT 


GATAACTTTG 


GTGTGCAATC 


TGTAACTGTA 


CCAAATACAT 


CACAAATTAC 


10140 




AGGTACTGTT 


GATAATAACC 


ATCAACATGT 


TTCTGCAACG 


GCACCAAATG 


TGACATCAGC 


10200 
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GTTCAATGTA ACAGTGAAAC CTTTGCGTGA TAAATATCGA GTTGGTACTT CATCAACGGC 10320 

TGCTAATCCT GTGAGAATTG CCAATATTTC GAATAATGCG ACAGTATCAC AAGCTGATCA 10360 

5 AACGACAATT ATTAATTCGT TAACGTTTAC TGAAACAGTA CCAAATAGAA GTTATGCAAG 10440 

AGCAAGTGCG AATGAAATCA CTAGTAAAAC AGTTAGTAAT GTCAGTCGTA CTGGAAATAA 10500 

TGCCAATGTg CACAGTAACT GTTACTTATC AAGATGGAAC AACATCAACA GTGACTGTAC 10560 

10 CTGTAAAGCA TGTCATTCCA GAAATCGTTG CACATTCGCA TTACACTGTA CAAGGCCAAG 10620 

ACTTCCCAGC AGGTAATGGT TCTAGTGCAT CAGATTACTT TAAGTTATCT AATGGTAGTG 10680 

ACATTGCAGA TGCAACTATT ACATGGGTAA GTGGACAAGC GCCAAATAAA GATAATACAC 10740 

15 

GTATTGGTGA AGATATAACT GTAACTGCAC ATATCTTAAT TGATGGCGAA ACAACGCCGA 10800 

TTACGAAAAC AGCAACATAT AAAGTAGTAA GAACTGTACC GAAACATGTC TTTGAAACAG 10860 

CCAGAGGTGT TTTATACCCA GGTGTTTCAG ATATGTATGA TGCGAAACAA TATGTTAAGC 10920 

20 

CAGTAAATAA TTCTTGGTCG ACAAATGCGC AACATATGAA TTTCCAATTT GTTGGAACAT 10980 

ATGGTCCTAA CAAAGATGTT GTAGG CATAT CTACTCGTCT TATTAGAGTG ACATATGATA 11040 

2S ATAGACAAAC AGAAGATTTA ACTATTTTAT CTAAAGTTAA ACCTGACCCA CCTAGAATTG 11100 

ACGCAAACTC TGTGACATAT AAAGCAGGTC TTACAAACCA AGAAATTAAA GTTAATAACG 11160 

TATTAAATAA CTCGTCAGTA AAATTATTTA AAGCAGATAA TACACCATTA AATGTCACAA 11220 

30 ATATTACTCA TGGTAG CGGT TTTAGTTCGG TTGTGACAGT AAGTGACGCG TTACCAAATG 1128 0 

GCGGAATTAA AGCAAAATCT TCAATTTCAA TGAACAATGT GACGTATACG ACGCAAGACG 1134 0 

AACATGGTCA AGTTGTTACA GTAACAAGAA ATGAATCTGT TGATTCAAAT GACAGTGCAa 114 00 

35 CAGTAACAGT GACACCACAA TTACAAGCAA CTACTGAAGG CGCTGTATTT ATTAAAGGTG 11460 

GCGA&GTTT TGATTTCGGA CACGTAGAAA GATTTATTCA AAACCCGCCA CATGGGGCAA 11520 

CGGTTGCATG GCATGATAGT CCAGATACAT GGAAGAATAC AGTCGGTAAC ACTCATAAAA 11580 

40 

CTGCGGTTGT AACATTACCT AATGGTCAAG GTACGCGTAA TGTTGAAGTT CCAGTCAAAG 11640 

TTTATCCAGT TGCTAATGCA AAGGCGCCAT CACGTGATGT GAAAGGTCAA AATTTGACTA 11700 

ATGGAACGGA TGCGATGAAC TACATTACAT TTGATCCAAA TACAAACACA AATGGTATCA 11760 

45 

CTGCAGCATG GGCAAATAGA CAACAACCAA ATAACCAACA AGCAGGCGTG CAACATTTAA 11820 

ATGTCGATGT CACATATCCA GGTATTTCAG CTGCTAAACG AGTTCCTGTT ACTGTTAATG 11880 

SO TATATCAATT TGAATTCCCT CAAACTACTT ATACGAGAAC GGTTGGAGGC ACTTTAGCAA 11940 

GTGGTACGCA AGCATCAGGA TATGCACATA TGCAAAATGC TACTGGTTTA CCAACAGATG 12000 
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10 



1S 



20 



25 



3S 



40 



4S 



TGAATAAACC 

ATACTTTTGC 

CAACTGTGAC 

TGAATACACA 

GTAACGTTGT 

CTGCAGCAAC 

CTTTCAACCC 

GTGATGAGCA 

CTAAGATTTG 

TTAATCCAAC 

ATAGTAAGAC 

CTGACTATGT 

AACCAAATTC 

ATCCAAGTAC 

ATTATGGTTC 

GTACTGCAAC 

CGACGATTCC 

TTTTCACAAA 

TAAGCACTGA 

CGCAACAACA 

CAACACCACA 

ATCAAGCTAA 

ATAACTTACA 

TTGATAACTA 

TTATTGACAA 

ACGCATTAAC 

AG CAAGCAGT 

TTACTGCTTA 

GCGCTAATGC 



GAATGTGGCT 

AACATCTTTA 

TGAAACAGCG 

TGCCGGTAAC 

GACGACATTT 

TGTAGCAGGT 

TGCTGATACA 

ACGTAGTGAT 

GCAAAATGGT 

TCAAGCAATG 

AATTAATGTT 

AACGTTAGAT 

ATCAATCACA 

ATTAACTGCA 

AAATGTAACA 

GATTAAAAAT 

TGTGACAGTA 

AGCGGATAAA 

AGGTAAAAAG 

AATCAATACT 

ACAAGTTTCT 

AGCATTACTT 

AAGTTCTGTG 

TAATGCGAAG 

TGGCGATGCA 

AGCATTAAAC 

GCAACAATTG 

CAATAATTCG 

TATTATTCAA 



AAAGTOGTTA 

CCAGCGAAAT 

GCAGGAGCGA 

GTAAOGACAT 

ACACGTCGCA 

ATTGCTGGAA 

ATTCAAGTTG 

GATTTCACAG 

CATATTGATA 

GATATTGCTT 

GTTCGTGGTC 

GCACAAACTG 

ATTACTCCGA 

CCGGCAGCTC 

GCAGCTGAAA 

GGCACAGCAA 

ACTTACAATG 

CGTGAGTTAA 

CCAGGTACAA 

GCGAAAACAG 

GACGCACTAA 

CAAAATAAAG 

AACCAAGTAC 

AAGCGTGAAG 

ACTGCACAAC 

CAAGCGAAAC 

AATCGCACAG 

ATTCGTGCAC 

AAGCCAATAA 



ACGCAAAATA 

TTGTAGTAAA 

TTACAATTGC 

ACGCTGATAA 

ATAATACGAG 

CTAATAATGG 

TTGCAACGCA 

TTGTCGCACC 

TCAOGCCTAA 

ACACTGAAAA 

AAAATAATCA 

GTAAAGTGAC 

AAGCAGGTAC 

ATACTGTCAA 

TTAACAATGC 

TGCCTACTAA 

ATGGTAGTAC 

TCACAGCTAA 

TTACGCAGTA 

AAGCACAACA 

CTAAAGTTCG 

AAGATAATAG 

CATCAACTGC 

CAGAAACTGA 

AAATTTCAGA 

ATGATTTAAC 

GTACAACGAC 

TTCAAAGTGA 

GAACAGTACA 



TGACGTCATC 
AGATGTGCAA 
ACCTGGAOCA 
ATTAGTTATT 
TCCATGGGTG 
TATTACTGTT 
AGGAAGCGGA 
ACAACCGAAC 
TAATCCATCA 
AGTGGGTAAT 
ATGGACAATT 
GTTCAATGCC 
AGGTCACTCA 
CACAACTGAA 
AGTTCaAGTT 
TTTAGCTGGT 
TGAAGAAGTA 
AAATCATTTA 
CAATAATGCA 
- AGTG ATT AAT - 
TGCAGCACAA 
CCAATTAGTA 
TGGTATGACG 
AATAACTGCA 
TGAAAAACAT 
TGCAGATACA 
TGGTAAGAAG 
CTTAACAAGT 
AGAAGTGCAA 



TATAACGGAC 

CCAGCGAAAC 

AACCAAAGAG 

AAACGTAATG 

AAAGAAGCAT 

GCAGCAGGTA 

GAGACAGTGA 

CAAGOGACTA 

GGACATTTAA 

GGTGCAGAAC 

GCGAATAAGC 

AATACTATAA 

GTAAGTAGTA 

ATTGTGAAAG 

GCTAATAAAC 

GGTAGCACAA 

CAA0AGTCCA 

GATGATCCAG 

ATGCATAATG 

AATGAGCGTG 

ACTAAGATTG 

ACGTCTAAAA 

CAACAAAGTA 

GCTCAACGTG 

CGTGTCGATA 

CATGCCTTAG 

CCGGCAAGTA 

GCTAAAAATA 

TCTGCGTTAA 



12120 
12180 
12240 
12300 
12360 
12420 
12480 
12540 
12600 
12660 
12720 
12780 
12840 
12900 
12960 
13020 
13060 
13140 
13200 
13260 
13320 
13380 
13440 
. 13500 
13560 
13620 
13680 
13740 
13800 
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CTGATAATAG TGCTTTAAAA ACTGCTAAGA 
TAACTACTGA TGGTATGACA CAATCATCAA 
5 GTCAAACAGA ATCAACAAAT GCACAAAATG 

AAATTGCCGC AGAAAAAACA AAAGTAGAAG 
CTGGATTAAC TCCAGACTTG GCACCATTAC 

10 

TTGATCAGCC AACGAGTACG ACTGGTATGA 
AACTTTCAGC AGCTAGAACT AAAATTCAAG 
ATGTTGCGAC AATAOGTCAA AACGTGACAG 

1S 

AAGCACGTAA TGGCTTAACA GTCGATAAAG 
AACATAGTAT TGACACGCAA ACAAGTACAA 

2 0 AGAATGCGAA GTTAACAGCT GCACGTAATA 

GTTCACCGAC TGTAGAACAA ATTAATACAA 
ATTTAGATCA TGCACGTCAA GCTTTAACAC 

26 CGCAATTAGA ACAAAGCATT AATCAACCAA 

TAAATGCGTA GAACCAAAAA TTACAAGCAG 
TGTTGAATGG CAACCCAACT GTCCAAAATA 

30 CTAAGGATCA ATTAAATACA GCACGTCAAG 

CAACATTACA TGGTGCATCT AACTTAAACC 
TTAATGCTGC TCAAAATcAT GctGCGCTTG 

36 

ATACTGCGAT GACGAAATTA AAAGACAGTG 
AAAATTACAC TGACGCAACA CCAGCTAATA 
CTAAAGGTGT CATTGGAGAA ACGACTAATC 

40 

AAGCAGCATC TGTTAAATCG ACGAAAGATG 
CGAAAACAGA AG C AACAAAT GCGATTACGC 

45 ATGCATTAAC ACAACAAGTG AATAGTGcAC 

AAACGACTCA AAGCTTAAAT ACTGCTATGA 
ACCAAGTCGT ACAAAGTGAT AATTATGTCA 

50 ACAATGCATA CAACCATGCG AATGACATTA 

CACCAAGTGA TGTTAACAAT GCTTTATCAA 

66 



CGAAACTTGA TGAAGAAATC AATAAATCAG 13920 

TCCAAGCATA TGAAAATGCT AAACGTGCGG 13980 

TTATTAACAA TGGTGATGCG ACTGACCAAC 14040 

AAAAATATAA TAGCTTAAAA CAAGCAATTG 14100 

AAACTGCAAA AACTCAGTTG CAAAATGATA 14160 

CAAGCGCATC TATTGCAGCA TTTAATGAAA 14220 

AAATTGATCG TGTATTAGCC TCACATCCAG 14280 

CAGCGAATGC CGCTAAATCA GCACTTGATC 14340 

CGCCTTTAGA AAATGCGAAA AATCAACTAC 14400 

CTGGTATGAC ACAAGACTCT ATAAATGCAT 14460 

AGATTCAACA AATCAATCAA GTATTAGCAG 14520 

ATACGTCTAC AGCAAATCAA GCTAAATCTG 14580 

CAGATAAAGC GCCGCTTCAA ACTGCGAAAA 14640 

CGGATACAAC AGGTATGACG ACCGCTTCGT 14700 

CGCGTCAAAA GTTAACTGAA ATTAATCAAG 14760 

TCAATGATAA AGTGACAGAG GCAAACCAAG 14820 

GTTTAACATT AGATAGACAG CCAGCGTTAA 14 880 

AAGCACAACA AAATAATTTC ACGCAACAAA 1494 0 

AAACAATTAA GTCTAACATT ACGGCTTTAA 15000 

TTGCGGATAA TAATACAATT AAATCAGATC 15060 

AACAAGCGTA TGATAATGCA GTTAATGCGG 15120 

CAACGATGGA TGTTAACACA GTGAACCAAA 15180 

CTTTAGATGG TCAACAAAAC TTACAACGTG 15240 

ATGCAAGTGA TTTAAACCAA GCACAAAAGA 15300 

AAAACGTGCA AGCAGTAAAT GATATTAAAC 15360 

CAGGTTTAAA ACGTGGCGTT GCTAATCATA 15420 

ACGCAGATAC TAATAAGAAA AATGATTACA 15480 

TTAATGGTAA TGCACAACAT CCAGTTATAA 15540 

ATGTCACAAG TAAAGAACAT GCATTGAATG 15600 
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ATTTAAATAA TGCACAACGT CAAAACTTAC 
ATGCAGTTAA TACAATTAAG CAAAATGCAA 
5 GACAAGCTGT TGCAGATAAA GATCAAGTGA 

CAGCTAAACA AAATGCATAT AACAGTGCAG 
CAACAAATCC AACGATGTCT GTTGATGATG 

10 

ATAAAAATGC ATTAAATGGT TATGAAAAAT 
CAATTGATGC ATTACCACAT TTAAATAATG 
ATGCTGCATC AAATATTGCT GGCGTAAATA 

IS 

CAkCGATGGg TAACTTGCAA GGTGCAATCA 
ACTATCAAGA TGCGACACCT AGTAAGAAAA 

20 AAGATATTTT AAATAAATCA AATCGTCAAA 

TGAATCAAGT GAATTCTGCT AAAAATAACT 
nCAAaCAGCA AAACAGCAGT TAAATAATAT 

25 TTTAACAAAC CAAATTAATA GTGGTACTAC 

TGCCAATACA TTAGATCAAG CCATGAATAC 
GACTAAAGCA AGTGAAGATT ACGTAGATGC 

30 CGCAGTAGCT GCTGCTGAAA CGATTATTAA 

TACGATTACA CAAAAAGCAG AGCAAGTGAA 
AAACTTAGCT GCTGCAAAAC AAAATGCGAA 

35 

AGATGCTCAA AAGAACAATT TGATTAGTCA 
TGAXACTGTA AAACAAAATG CGCAACATCT 
TATTAACAAC GAATCTCAAG TGAAATCATC 

40 

ACAACAAGAG TATGATAATG CTATTACTGC 
TCCAAACACT GCGCAAAATG CAGTTGAAGC 
TGCATTGAAT GGTGATGCAA AATTAATTGC 
TACTTTAACG CATATCACTA CAGCTCAACG 
TACAAACTTA GCTGGTGTTG AATCTGTTAA 
SO GGGTAACTTA CAAACGGCTA TCAACGATAA 

GGATGCTGAT GAGCAAAAAC GTAATGCATA 



AATCGCAAAT TAATGGTGCG CATCAAATTG IS 72 0 

CAAACTTGAA TAGTGCAATG GGTAACTTAA 15780 

AACGTACAGA AGATTATGCG GATG CAGATA 1584 0 

TTTCAAGTGC CGAAACAATC ATTAATCAAA 15900 

TTAATCGTGC AACTTCAGCT GTTACTTCTA 15960 

TAGCACAATC TAAAACAGAT GCTGCAAGAG 16020 

CACAAAAAGC AGATGTTAAA TCTAAAATTA 16080 

CTGTTAAACA ACAAGGTACA GATTTAAATA 1614 0 

ATGATGAACA AACGACGCTT AATAGTCAAA 16200 

CAGCATACAC AAATGCGGTA CAAGCTGCGA 16260 

ATAAAACGAA AGATCAAGTT ACTGAAGCGA 16320 

TAGATGGTAC GCGTTTATTA GATCAAGCGA 16380 

GACGCATTTA ACAACTGCAC AAAAAACGAA 1644 0 

TGTCGCTGGT GTTCAAACGG TTCAATCAAA 16500 

GTTAAGACAA AGTATTGCCA ACAAAGATGC 16560 

TAATAATGAT AAGCAAACAG CATATAACAA 1662 0 

TGCTAATAGT AATCCAGAAA TGAATCCAAG 16680 

TAGTTCTAAA ACGGCACTTA ACGGTGATGA 1674 0 

AACGTACTTA AACACATTGA CAAGTATTAC 1680 0 

AATTACTAGT GCGACAAGAG TGAGTGGTGT 1686 0 

AGAC CAAGCT ATGGCTAGCT TACAGAATGG 16 920 

TGAGAAATAT CGTGATGCTG ATACAAATAA 1698 0 

AGCGAAAGCG ATTTTAAATA AATCGACAGG 1704 0 

AGCATTACAA CGTGTTAATA ATGCGAAAGA 17100 

AGCTCAAAAC GCAGCGAAAC AACATTTAGG 17160 

TAATGATTTA ACAAATCAAA TTTCACAAGC 17220 

ACAAAATGCG AATAGTTTAG ATGGTGCTAT 17280 

GTCAGGAACA TTAGCGAGCC AAAACTTCTT 17340 

CAAT CAAGCT GTATCAGCAG CCGAAACCAT 17400 
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TGTTAATAAT 


GCGAAACATG 


CATTAAATGG 


TACGCAAAAC 


TTAAACAATG 


CGAAACAAGC 


17520 




AGCGATTACA 


GCAATCAATG 


GCGCATCTGA 


TTTAAATCAA AAACAAAAAG 


ATGCATTAAA 


17580 


5 


AGCACAAGCT 


AATGGTGCTC 


AACGCGTATC 


TAATGCACAA 


GATGTACAGC 


ACAATGCGAC 


17640 




TGAACTGAAC 


AOGGCAATGG 


GCACATTAAA 


ACATGCCATC 


GCAGATAAGA 


CGAATACGTT 


17700 




AGCAAGCAGT AAATATGTTA 


ATGCCGATAG 


CACTAAACAA AATGCTTACA 


CAACTAAAGT 


17760 


10 


TACCAATGCT 


GAACATATTA 


TTAGCGGTAC 


GCCAACGGTT 


GTTACGACAC 


CTTCAGAAGT 


17820 




AACAGCTGCA 


GCTAATCAAG 


TAAACAGCGC 


GAAACAAGAA 


TTAAATGGTG 


ACGAAAGATT 


17880 


15 


ACGTGAAGCA AAACAAAACG 


CCAATACTGC 


TATTGATGCA 


TTAACACAAT 


TAAATACACC 


17940 


TCAAAAAGCT 


AAATTAAAAG 


AACAAGTGGG 


ACAAGCCAAT AGATTAGAAG ACGTACAAAC 


18000 




TGTTCAAACA 


AATGGACAAG 


CATTGAACAA 


TGCAATGAAA 


GGCTTAAGAG 


ATAGTATTGC 


18060 


20 


TAACGAAACA 


ACAGTCAAAA 


CAAGTCAAAA 


CTATACAGAC 


GCAAGTCCOA ATAACCAATC 


18120 




AACATATAAT 


AGCGCTGTGT 


CAAATGCGAA 


AGGTATCATT 


AATCAAACTA 


ACAATGCGAC 


18180 




TATGGATACT 


AGTGCGATTA 


CCCAAGCTAC 


AACACAAGTG 


AATAATGCTA 


AAAATGGTTT 


18240 


25 


AAACGGTGCT 


GAAAACTTAA 


GAAATGCACA 


AAACACTGCT 


AAGCAAAACT 


TAAATACATT 


18300 




ATCACACTTA 


ACAAATAACC 


AAAAATCTGC 


CATCTCATCA 


CAAATTGATC 


GTGCAGGTCA 


18360 




TGTGAGTGAG 


GTAACTGCTA 


CTAAAAATGC 


AGCAACTGAG 


TTGAATACGC 


AAATGGGTAA 


18420 


30 


CTTGGAACAA 


GCTATCCATG 


ATCAAAACAC 


AGTTAAACAA 


AGTGTTAAAT 


TTACTGATGC 


18480 




AGATAAAGCT 


AAACGTGATG 


CGTATACAAA 


TGCGGTAAGC 


AGAGCTGAAG 


CAATTCTGAA 


18540 




TAAAACGCAA 


GGTGCAAATA 


CGTCTAAACA 


AGATGTTGAA 


GCGGCTATTC 


AAAATGTTTC 


18600 


35 


AAGTGCTAAA 


AATGCATTGA 


ATGGTGATCA 


AAACGTTACA 


AATGCGAAGA 


ATGCAGCTAA 


18660 




AAATGCATTA AATAACTTAA 


CGTCAATTAA 


TAATGCACAA 


AAACGTGACT 


TAACAACTAA 


18720 


40 


AATTGATCAA 


GCAACAACTG 


TAGCTGGTGT 


TGAAGCTG TA 


TCTAATACGA 


GTACACAATT 


18780 


GAAtACAGCG ATGGCTAACT 


TGCAAAATGG 


TATTAATGAT 


AAAACAAATA 


CACTAGCAAG 


18840 




TGAAAACTAT 


CATGATGCTG 


ATTCAGATAA 


GAAAACTGCT 


TATACTCAAG 


CCGTTACGAA 


18900 


45 


CGCAGAAAAT 


ATTTTAAATA 


AAAATAGTGG 


ATCAAATTTA 


GACAAAACTG 


CCGTTGAAAA 


18960 




CGCGTTGTCA 


CAAGTTGCTA 


ATGCGAAAGG 


TGCCCTAAAT 


GGTAACCATA 


ATTTAGAGCA 


19020 




AGCTAAATCA AATGCAAACA 


CTACTATAAA 


CGGACTTCAA 


CATTTAACAA 


CTGCTCAAAA 


19080 


50 


AGATAAATTG 


AAACAACAAG 


TGCAACAAGC 


ACAAAATGTT 


GCAGGTGTAG 


ATACTGTTAA 


19140 




ATCAAGTGCC 


AACACATTAA 


ATGGTGCTAT 


GGGTACGTTA 


AGAAATAGCA 


TACAAGATAA 


19200 



55 



462 



EP0 786 519 A2 





TAACAATGCT 


GTTGATAGTG 


CTAATGGTGT 


CATTAATGCA ACAAGCAATC 


CAAATATGGA 






TGCTAATGCA 


ATTAACCAAA 


TCGCTACACA 


AGTGACATCA 


ACGAAAAATG 


CATTAGATGG 




5 


TACACATAAT 


TTAACGCAAG 


CGAAACAAAC 


AGCAACAAAT 


GCCATCGATG 


GTGCTACTAA 






CTTAAATAAA 


GCGCAAAAAG 


ATGCGTTAAA AGCACAAGTT 


ACAAGTGCGC 


AACGTGTTGC 




10 


AAATGTAACA 


AGTATCCAAC 


AAACTGCAAA 


TGAACTTAAT 


ACAGCTATGG 


GTCAATTACA 




ACATGGTATT GATGATGAAA ATGCAACAAA ACAAACTCAA AAATATCGTQ ACQcTQAACA 


i q c o n 




AAGTAAGAAA 


ACTGCTTATG 


ATCAAGCTGT 


AGCTGCTGCG 


AAAGCAATTT 


TAAATAAACA 




1S 


AACAGGTTCA 


AATTCAGATA 


AAGCAGCAGT 


TGACCGTGCA 


TTACAACAAG 


TAACAAGTAC 


19740 


GAAAGATGCA 


TTGAATGGTG 


ATGCAAAACT 


GGCAGAAGCG 


AAAGCGGCAG 


CTAAACAAAA 


19800 






TTAAACCATA 


TTACGAATGC 


ACAACGTACT 


GACTTAGAAG 


GCCAAATCAA 


19860 


20 


TCAAGCGACG 


ACTGTTGATG 


GCGTTAATAC 


TGTAAAAACA 


AATGCCAATA 


CATTAGACGG 


19920 




CGCAATGAAT 


AGCTTACAAG 


GTTCAATCAA 


TGATAAAGAT 


GCGACATTAA 


GAAATCAAAA 


19980 




TTATTTTYJAT 

A X.^1 X \v X X VJ^^ X 


GCGGATGAAT 


CAAAACGAAA 


TGCATATACG 


CAAGCTGTCA 


CAGCGGCTGA 


20040 


25 


AGGCATTTTA 

flW Wk A X X x^% 


AATAAACAAA 


CTGGTGGTAA 


CACATCTAAA 


GCAGACGTTG 


ATAATGCATT 


20100 




AAATGCAGTT 


ACAAGAGCGA AAGcGgCTTT AAATGGTGCT GACAACTTAA GAAATGCGAA 


20160 




AACTTCAGCA 


ACAAATACGA 


TTGATGGTTT 


ACCTAACTTA 


ACACAATTAC 


AAAAAGACAA 


20220 


30 


CTTGAAGCAT 


CAAGTTGAaC 


AAGCGCAAAA 


TGTAGCAGGT GTAAATGGTG TTAAAGATAA 


20280 




AGGTAATACG 


TTAAATACTG 


CCATGGGTGC 


ATTACGTACA 


AGTATCCAAA 


ATGATAATAC 


20340 




GACGAAAACA 


AGTCAAAATT 


ATCTTGATGC 


ATCTGACAGC 


AACAAAAATA ATTACAATAC 


20400 


35 


TGCTGTAAAT 


AATGCAAATG 


GTGTTATTAA 


TGCAACGAAC 


AATCCAAATA TGGATGCTAA 


20460 




TGCGATTAAT 


GGCATGGCAA 


ATCAAGTCAA 


TACAACAAAA 


GCAGCGTTAA ATGGTGCACA 




40 


AAACTTAGCT 


CAAGCTAAAA 


CAAATGCGAC 


GAACACAATT 


AACAACGCAC 


ATGACTTAAA 


20580 


CCAAAAACAA 


AAAGATGCAT 


TAAAAACACA 


AGTTAACAAT 


GCACAACGTG 


TATC TGATGC 


^Ud40 




AAATAACGTT 


CAACACACTG 


CAACTGAATT 


GAACAGTGCG 


ATGACAGCAC 


TTAAAGCAGC 


/uu 


45 


TATTGCTGAT 


AAAGAAAGAA 


CAAAAGCAAG 


CGGTAATTAT 


GTCAATGCTG 


ATCAAGAAAA 


20760 




ACGTCAAGCG 


TATGATTCAA 


AAGTGACTAA 


CGCTGAAAAT 


ATCATTAGTG 


GTACACCGAA 


20820 




TGCGACATTA 


ACAGTCAATG 


ACGTAAATAG 


TGCGGCATCA 


CAAGTCAATG 


CGGCTAAAAC 


20880 


SO 


AGCATTAAAT 


GGTGATAACA 


ACTTACGTGT 


AGCGAAAGAG 


CATGCCAACA 


ATACAATTGA 


20940 




CGGCTTAGCA 


CAATTGAATA 


ATGCACAAAA 


AGCAAAATTA 


AAAGAACAAG 


TTCAAAGTGC 


21000 
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OAAAGGCTTA AGAGATAGTA TTGCGAATGA AGCAACAATT AAAGCAGGTC AAAACTACAC 


21120 




TGACGCAAGT 


CCAAATAATC 


GTAACGAGTA 


CGACAGTGCA 


GTTACTGCAG 


CAAAAGCAAT 


21180 


5 


CATTAATCAA 


ACATCGAACC 


CAACGATGGA 


ACCAAATACT 


ATTACGCAAG 


TAACATCACA 


21240 




AGTGACAACT 


AAAGAACAGG 


CATTAAATGG 


TGCGCGAAAC 


TTAGCTCAAG 


CTAAGACAAC 


21300 




TGCGAAAAAC 


AACTTGAATA 


ACTTAACATC 


AATTAACAAT 


GCACAAAAAG 


ATGCGTTAAC 


21360 


m 


GCGTAgcATT GATGGTGCAA CAACAGTAGC TGGTGTAAAT CAAGAAACTG 


CAAAAGCAAC 


21420 




AGAATTAAAT 


AACGCAATGC 


ATAGTTTACA 


AAATGGTATC 


AATGATGAGA 


CACAAACAAA 


21480 


IS 


ACAAACTCAG 


AAATACCTAG 


ATGCAGAGCC 


AAGTAAGAAA 


TCAGCTTATG 


ATCAAGCAGT 


21540 


AAATGCAGCG 


AAAGCAATTT 


TAACAAAAGC 


TAGTGGTCAA 


AATGTAGACA AAGCAGCAGT 


21600 




TGAACAAGCA 


TTGCAAAATG 


TGAACAGTAC 


GAAGACGGCG 


TTGAACGGTG 


ATGCGAAATT 


21660 


20 


AAATGAAGCT 


AAAGCAGCTG 


CGAAACAAAC 


GTTAGGTACA 


TTAACACACA 


TTAATAATGC 


21720 




ACAACGTACA 


GCGTTAGACA 


ATGAAATTAC 


ACAAGCAACA 


AATGTTGAAG 


GTGTTAATAC 


21780 




AGTTAAAGCC 


AAAGCGCAAC 


AATTAGATGG 


TGCTATGGGT 


CAATTAGAAA 


CATCAATTCG 


21840 


25 


TGATAAAGAC 


ACGACGTTAC 


AAAGTCAAAA 


TTATCAAGAT 


GCTGATGATG 


CTAAACGAAC 


21900 




TGCTTATTCT 


CAAGCAGTAA 


ATGCAGCAGC 


AACTATTTTA AATAAAACAg CTGGCGGTAA 


21960 




TACACCTAAA 


GCAGATGTTG 


AAAGAGCAAT 


GCAAGCTGTT 


ACACAAGCAA 


ATACTGcATT 


22020 


30 


AAACGGTATT 


CAmAACTTAG 


ATCGTGCGAA 


ACArGCTGCT 


AACACAGCGA 


TTACAAATGC 


22080 




TTCGGACTTA 


AATACAAAAC 


mAAAAGAAGC 


ATTAAAAgCA CAAGTAACAA GTGCAGGACG 


22140 




TGTATCTGCA 


G CAAATGGTG 


TTGAACATAC 


TGCGACTGAA 


TTAAATACTG 


CGATGACAGC 


22200 


35 


TTTAAAGCGT 


GCCATTGCTG 


ATAAAGCTGA 


GACAAAAGCT 


AGTGGTAACT 


ATGTCAATGC 


22260 




TGATCJCGAAT 


AAACGTCAAG 


CATATGATGA 


AAAAGTTACA 


GCTGCCGAAA 


ATATCGTTAG 


22320 


40 


TGGTACACCA 


ACACCAACGT 


TAACACCAGC 


AGATGTTACA 


AATGCAGCAA 


CGCAAGTAAC 


22380 


GAATG CTAAG 


ACGCAGTTAA 


ACGGTAATCA 


TAATTTAGAA 


GTAGCGAAAC 


AAAATGCTAA 


22440 




CACTGCAATT 


GATGGTTTAA 


CTTCTTTAAA 


TGGTCCGCAA 


AAAGCAAAAC 


TTAAAGAACA 


22500 


45 


AGTGGGTCAA 


GCGACGACGT 


TGCCAAATGT 


TCAAACTGTT 


CGTGATAATG 


CACAAACATT 


22560 




AAACACTGCA 


ATGAAAGGTC 


TACGAGATAG 


CATTGCGAAT 


GAAGCAACGA 


TTAAAGCAGG 


22620 




TCAAAACTAC 


ACAGATGCAA 


GTCAAAACAA 


ACAAACTGAC 


TACAACAGTG 


CAGTCACTGC 


22680 


60 


AGCAAAAGCA 


ATCATTGGTC 


AAACAACTAG 


TCCATCAATG 


AATGCG CAAG 


AAATTAATCA 


22740 




AGCGAAAGAC 


CAAGTGACAG 


CTAAACAACA 


AGCGTTAAAC 


GGTCAAGAAA 


ACTTAAGAAC 


22800 
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AGATGCAQTG 


> AAACGTCAM 


l TCGAAGGTGC 


nn^.uw\ iVJl 1 


1 nnTrzii a (Trail 




22920 




AAATAATGCG 


GATGCaTTAA 


i ATACAGCTAT 




AAAAATGGTA 


TTCAAGATCA 


22980 


5 


GAATACGATT 


AAGCAAGGTG 






GAAGCGAAAC 


GTAATGCATA 


23040 




TACAAATGCA 


GTGAOGCAAG 


CTGAACAAAT 


TTTA A ATA A IV 


GCACAAGGTC 


CAAATACTTC 


23100 


10 


AAAAGACOGT 


GTCGAAACTG 


CGTTAGAaAA 


TGTACAACGT 


GCTAAAAACG 


AATTGAACGG 


23160 


TAATCAAAAT 


GTTGCGAACG 


CTAAGACAAC 


TGCGAAAAAT 


GCATTGAATA AC CTAACATC 


23220 




AATTAATAAT 


GCACAAAAAG 


AAGCATTGAA 


ATCACAAATT 


GAAGGTGCGA 


CAACAGTTGC 


23280 


1S 




CAAGTGTCTA 


CAACGGCATC 


TGAATTAAAT 


ACAGCAATGA 


GCAACTTACA 


23340 


AAATGGTATT 


AATGATGAAG 


CAGCTACAAA AGCAGCGCTT 


AATGGTACTC 


AAAACCTTGA 


23400 




AAAAGCTAAA 


CAACACGCAA ATACAGCAAT 


TGACGGTTTA 


AGCCATTTAA 


CAAATGCACA 


23460 


20 


AAAAGAGGCA 


TTAAAACAAT 


TGGTACAACA ATCGACTACT 


GTTGCAGAAG 


CACAAGGTAA 


23520 




TGAGCAAAAA 


GCAAACAATG 


TTGATGCAGC 


AATGGACAAA 


TTACGTCAAA 


GTATTGCAGA 


23580 




TAATGCGACA ACAAAACAAA ACCAAAATTA 


TACTGATGCA 


AGTCAGAATA 


AAAAGOATGC 


23640 


25 


GTACAATAAT 


GCTGTCACAA 


CTGCACAAGG 


TATTATTGAT 


CAAACTACAA 


GTCCAACTTT 


23700 




AGATCCGACT 


GTTATCAATC 


AAGCTGCTGG 


ACAAGTAAGC 


ACAACTAAAA 


ATGCATTAAA 


23760 




TGGTAATGAA 


AACCTAGAGG 


CAGCGAAACA 


ACAAGCGTCA 


CAATCATTAG 


GTTCATTAGA 


23820 


30 


TAACTTAAAT 


AATGCGCAAA 


AACAAACAGT 


TACTGATCAA ATTAATGGCG CGCATACTGT 


23880 




TGATGAAGCA 


AATCAAATTA AGCAAAATGC 


GCAAAACTTA AATACAGCGA 


TGGGTAACTT 


23940 


35 


GAAACAAGCG 


ATAGcTGACA 


AAGATGCTAC 


GAAAGCGACA 


GTTAACTTCA 


CTGATGCAGA 


24000 


TCAAGCAAAA 


CAACAAGCAT 


ATAACaCTGC 


TGTTACAAAT ' 


GCTGAAAATA" 


TCATTTCAAA 


24060 




AGCTAATGGC 


GGCAATGCAA 


CACAAGCTGA 


AGTTGAACAA 


GCAATCAAAC 


AAGTTAATGC 


24120 


40 


TGCAAAACAA 


GCATTAAATG 


GTAATGCCAA 


CGTTCAACAT 


GCAAAAGACG 


AAGCAACAGC 


24 180 


ATTAATTAAT 


AGCTCTAATG 


ACCTTAACCA 


AGCACAAAAA 


GACGCATTAA 


AACAACAAGT 


24240 




TCAAAATGCA 


ACTACTGTAG 


CTGGTGTAAA 


CAATGTTAAA 


CAAACAGCAC 


AAGAGTTAAA 


24300 


45 


CAATGCTATG 


ACACAATTAA 


AACAAGGCAT 


TGCAGATAAA 


GAACAAACAA 


AAGCTGATGG 


24360 




TAACTTTGTC 


AATGCAGATC 


CTGATAAGCA 


AAATGCATAT 


AATCAAGCAG 


TAGCGAAAGC 


24420 




TGAAGCATTA 


ATTAGTGctA 


CGCCTGATGT 


TGTCGTTACA 


CCTAGCGAAA 


TTACTGCAGC 


24480 


SO 


GTTAAATAAA 


GTTACGCAAG 


CTAAAAATGA 


TTTAAATGGT 


AATACAAACT 


TAGCAACGGC 


24540 




GAAACAAAAT 


GTTCAACATG 


CTATTGATCA 


ATTGCCAAAC 


TTAAACCAAG 


CGCAACGTGA 


24600 
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AGCGGCGACA ACGCTTAATO 


ACGCGATGAC ACAATTGAAA 


CAAGGTATTG 


CGAATAAAGC 


24720 




ACAAATTAAA 


GGTAGCGAGA ACTATCACGA TGCTGATACT GACAAGCAAA 


CAGCATATGA 


24780 


5 


TAATGCAGTA 


ACAAAAGCAG 


AAGAATTGTT 


AAAACAAACA 


ACAAATCCAA 


CAATGGATCC 


24840 




AAATACAATT 


CAACAAGCAT 


TAACTAAAGT 


GAATGACACA AATCAAGCAC 


TTAACGGTAA 


24900 




TCAAAAATTA 


GCTGATGCCA 


AACAAQATGC 


1 AAbACAAuA 


CTTGGTACAC 


TAGATCATTT 


24960 


10 


AAATGATGCT 


CAAAAACAAG 


CGCTAACAAC 


TCAAGTTGAA 


CAAG CACCAG 


ATATTGCAAC 


25020 




AGTTAATAAT 


GTTAAGCAAA 


ATGCTCAAAA 


TCTGAATAAT 


GCTATGACTA 


ACTTAAACAA 


25080 


1S 


TY5PATT 21 P2VZV 


GATAAAACTG 


AGACATTAAA 


TAGCATTAAC 


TTTACTGATG 


CAGATCAAGC 


25140 




GCTTATACTA ATGCGGTTTC 


ACATGCAGAA 


GGTATTTTAT 


CTAAAGCAAA 


25200 




losi UuiLAAi 


GCAAGTCAAA 


CTGAAGTGGA 


ACAAGCGATG 


CAACGTGTGA 


ACGAAGCGAA 


25260 


20 


ACAAGCATTG 


AATGGTAATG 


ACAATGTACA 


ACGTGCAAAA 


GATGCAGCGA 


AACAAGTGAT 


25320 




TACAAATGCA 


AATGATTTAA 


ATCAAGCAAT 


GACACAATTG 


AAACAAGGTA 


TTGCAGATAA 


25380 




AGACCAAACT 


AAAGCAAATG 


GTAACTTTGT 


CAATGCTGAT 


ACTGATAAGC 


AAAATGCTTA 


25440 


25 


GAACAATGCG 


GTAGCACATG 


CTGAACAAAT 


AATTAGTGGT 


ACACCAAATG 


CAAACGTGGA 


25500 




TCCACAACAA 


GTGGCTCAAG 


CGTTACAACA 


AGTGAATCaA 


GCTAAGGGTG 


ATTTAAACGG 


25560 




TAACCATAAC 


TTACAAGTTG 


CTAAAGACAA 


TGCAAATACA 


GCCATTGATC 


AGTTACCAAA 


25620 


30 


CTTAAATCAA 


CCACAAAAAA 


CAGCATTAAA 


AGAC CAAGTG 


TCGCATGCAG 


AACTTGTTAC 


25680 




AGGTGTTAAT 


G CTATTAAGC 


AAAATGCTGA 


TGCGTTAAAT 


AATGCAATGG 


GTACATTGAA 


25740 




ACAACAAATT 


CAAGCGAACA 


GTCAAGTACC 


ACAGTCAGTT 


GACTTTACAC 


AAGCGGATCA 


25800 


35 


AGACAAACAA 


CAAGCATATA 


ACAATGCGGC 


TAAC CAAGCG 


CAACAAATCG 


CAAATGGCAT 


25860 




ACCAACACCT GTATTGACGC 


CTGATACAGT 


AACACAAGCA 


GTGACAACTA 


TGAATCAAGC 


25920 


40 


GAAAGATGCA 


TTAAACGGTG 


ATGAAAAATT 


AGCACAAGCG 


AAACAAGAAG 


CTTTAGCAAA 


25980 


TCTTGATACG 


TTACGCGATT 


TAAATCAACC 


ACAACGTGAT 


GCATTACGTA 


ACCAAATCAA 


26040 




TCAAGCACAA 


GCGTTAGCTA 


CAGTTGAACA 


AACTAAACAA 


AATGCACAAA 


ATGTGAATAC 


26100 


45 


aGCaATGAGT 


AACTTGAAAC 


aAGGTATTGC 


aAACAAAGAT 


ACTGTCAAAG 


CAAGTGAGAA 


26160 




CTATCATGAT 


GCTGATG CCG 


ATAAGCAAAC 


AGCATATACA 


AATGCAGTGT 


CTCAAGCGGA 


26220 




AGGTATTATC 


AATCAAACGA 


CAAATCCAAC 


GCTTAACCCA 


GATGAAATAA 


CACGTGCATT 


26280 


SO 


AACTCAAGTG 


ACTGATG CTA 


AAAATGGCTT 


AAACGGTGAA 


GCTAAATTGG 


CAACTGAAAA 


26340 




GCAAAATGCT 


AAAGATGCCG 


TAAGTGGGAT 


GACGCATTTA 


AACGATGCTC 


AAAAACAAGC 


26400 
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AGCAACGAGC 


CTAGATCAAG 


CAATGGATCA ATTATCACAA 


GCTATTAATG 


ATAAAGCTCA 


26520 




AACATTAGCG 


GACGGTAATT 


ACTTAAATGC 


AGATCCTGAC 


AAACAAAATG 


CGTATAAACA 


26580 


5 


GGCAGTAGCA AAAGCTGAAG 


CATTATTGAA TAAACAAAGT 


GGTACTAATG 


AAGTACAAGC 


26640 




ACAAGTTGAA AGCATCACTA ATGAAGTGAA CGCAGCGAAA CAAGCATTAA ATGGTAATGA 


26700 




CAATTTGGCA 


AATGCAAAAC 


AACAAGCAAA 


ACAACAATTG 


GCGAACTTAA 


CACACTTAAA 


26760 


10 


TGATGCACAA 


AAACAATCAT 


TTGAAAGTCA 


AATTACACAA 


GCGCCACTTG 


TTACAGATGT 


26820 




CACTACGATT 


AATCAAAAAG 


CACAAACGTT 


AGATCATGCG 


ATGGAATTAT 


TAAGAAATAG 


26880 


IS 


TGTTGCGGAT 


AATCAAACGA 


CATTAGCGTC 


TGAAGATTAT 


CATGATGCAA 


CTGCGCAAAG 


26940 


ACAAAATGAC 


TATAACCAAG 


CTGTAACAGC 


TGCTAATAAT 


ATAATTAATC 


AAACTACATC 


27000 




GCCTACGATG 


AATCCAGATG 


ATGTTAATGG 


TGCAACGACA 


CAAGTGAATA 


ATACGAAAGT 


27060 


20 


TGCATTAGAT 


GGTGATGAAA 


ACCTTGCAGC 


AGCTAAACAA 


CAAGCAAACA 


ACAGACTTGA 


27120 




TCAATTAGAT 


CATTTGAATA 


ATGCGCAAAA 


GCAACAGTTA 


CAATCACAAA 


TTAOGCAATC 


27180 




ATCTGATATT 


GCTGCAGTTA 


ATGGTCACAA 


ACAAACAGCA 


GAATCTTTAA 


ATACTGCGAT 


27240 


2S 


GGGTAACTTA 


ATTAATGCGA 


TTGCAGATCA 


TCAAGCCGTT 


GAACAACGTG 


GTAACTTCAT 


27300 




CAATGCTGAT 


ACTGATAAAC 


AAACTGCTTA 


TAATACAGCG 


GTAAATGAAG 


CAGCAGCAAT 


27360 




GATTAACAAA 


CAAACTGGTC 


AAAATGCGAA 


CCAAACAGAA 


GTAGAACAAG 


CTATTACTAA 


27420 


30 


AGTTCAAACA 


ACACTTCAAG 


CGTTAAATGG 


AGACCATAAT 


TTAGAAGTTG 


CTAAAACAAA 


27480 




TGCGACGCAA 


GCAATTGATG 


CTTTAACAAG 


CTTAAATGAT 


CCTCAAAAAA 


CAGCATTAAA 


27540 




AGAC CAAGTT 


ACAGCTGCAA 


CTTTAGTAAC 


TGCAGTT CAT 


CAAATTGAAC 


AAAATGCGAA 


27600 


3S 


TACGCTTAAC 


CAAGCAATGC 


ATGGTTTAAG 


ACAGAGCATT 


CAAGATAACG 


GAGCAACTAA 


27660 




AGCAAATAGC 


AAATATATCA 


ACGAAGATCA 


ACCAGAGCAA 


CAAAACTATG 


ATCAAGCTGT - 


27720 


40 


TCAAGCCGCA 


AATAATATTA 


TCAATGAACA 


AACTGCAACA 


TTAGATAATA 


ATGCGATTAA 


27780 


TCAAGCAGCG 


ACAACTGTGA 


ATACAACGAA 


AGCAGCATTA 


CATGGTGATG 


TGAAGTTACA 


27840 




AAATGATAAA 


GATCATGCTA 


AGCAAACGGT 


TAGTCAATTA 


GCACATCTAA 


ACAATGCACA 


27900 


45 


AAAACATATG 


GAAGATACGT 


TAATTGATAG 


TGAAACAACT 


AGAACAGCAG 


TTAAGCAAGA 


27960 




TTTGACTGAA 


GCACAAGCAT 


TAGATCAACT 


TATGGATGCA 


TTACAACAAA 


GTATTGCTGA 


28020 




CAAAGATGCA 


ACACGTGCGA 


GCAGTGCATA 


TGTCAATGCA 


GAACCGAATA 


AAAAACAATC 


2B080 


SO 


CTATGATGAA 


GCAGTTCAAA 


ATGCTGAGTC 


TATCATTGCA 


GGATTAAATA ATCCAACTAT 


28140 




CAATAAAGGT 


AATGTATCAA 


GTGCGACTCA 


AGCAGTAATA 


TCATCTAAAA 


ATGCATTAGA 


28200 
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TCAATTAACA CCAGCTCAAC AACAAGCGCT AGAAAATCAA ATTAATAATG 


CAACAACTCG 


29320 




TQATAAAGTV; 


GCTGAAATCA TTGCACAAGC GCAAgCATtA AATGAAGCGA TGAAAGCATT 


28380 


5 




nil /viuun 1 v- 




(iv'iii j\ oofv now 
TUAAG CAAGT 


AGTAAATTTA 


ffmft « OO Ti OO IV 

TTAACGAGGA 


28440 




tva arvw*' & & 




ji rp t» /no OR AOO 

AT ACQ CAAGC 


AGTACAACAC 


GCGAAAGATT 


TGATTAACAA 


28500 




AKUARt- I\j A 1 


CCTACATTAG 


CTAAATCAAT 


CATTGATCAA 


GCGACACAGG 


CAGTGACAGA 


28560 


10 


TGCTAAAAAC 


AATTTACATG 


GTGATCAAAA 


ACTAGCTCAA 


GATAAGCAAC 


GTGCAACAGA 


28620 




AACGTTAAAT 


AACTTGTCTA 


ACTTGAATAC 


ACCACAACGT 


CAAGCACTTG 


AAAATCAAAT 


28680 


1S 


TAATAATGCA 


GCAACTCGTG 


GCGAAGTAGC 


ACAAAAATTA 


ACTGAAGCAC 


AAGCACTTAA 


28740 


CCAAGCAATG 


GAAGCTTTAC 


GTAATAG CAT 


TCAAGATCAA 


CAGCAAACGG 


AAGCGGGTAG 


28800 




CAAGTTTATC 


AATGAAGATA 


AaCCaCmAAA 


AGrTGCTTAC 


CAAGCAGCAG 


TTCAAAATGC 


28860 


20 


AAAAGATTTA 


ATTAATCAAA 


CTAACAATCC 


AACGCTTGAT 


AAAGCACAAG 


TTGAACAATT 


28920 




GACACAAGCT 


GTTAACCAAG 


CTAAAGATAA 


CCTACACGGT 


GATCAAAAAC 


TTGCAGACGA 


28980 




TAAACAACAT 


GCGGTTACTG 


ATTTAAATCA 


ATTAAATGGT 


TTGAATAATC 


CGCAACGTCA 


29040 


25 


AGCACTTGAA 


AGCCAAATAA 


ACAACGCAGC 


AACTCGTGGC 


GAAGTAGCAC 


AAAAATTAGC 


29100 




TGAAGCAAAA 


GCGCTTGATC 


AAGCAATGCA 


AGCATTACGT 


AATAGTATTC 


AAGATCAACA 


29X60 




ACAAACAGAA 


TCTGGTAGCA 


AGTTTATCAA 


TGAAGATAAA 


CCGCAAAAAG 


ATGCTTACCA 


29220 


30 


AGCAGCAGTT 


CAAAATGCAA 


AAGATTTAAT 


TAACCAAACA 


GGTAATCCAA 


CACTCGACAA 


29280 




ATCACAAGTA 


GAACAATTGA 


CACAAGCAGT 


AACAACTGCA 


AAAGATAATC 


TACATGGTGA 


29340 




TCAAAAACTT 


GCTCGTGATC 


AACAACAAGC 


AGTAACAACT 


GTAAATGCAT 


TGCCAAACTT 


29400 


35 


AAATGATGCA 


CAACAACAAG 


CATTAACTGA 


TGCTATAAAT 


GCAGCGCCTA 


CAAGAACAGA 


29460 




GGTTSCACAA 


CATGTTCAAA 


CTGCTACTGA 


ACTTGATCAC 


GCGATGGAAA 


CATTGAAAAA 


29520 


40 


TAAAGTTGAT 


CAAGTGAATA 


CAGATAAGGC 


TCAACCAAAT 


TACACTGAAG 


CGTCAACTGA 


29580 


TAAAAAAGAA 


GCAGTAGATC 


AAGCGTTACA 


AGCTGCAGAA 


AGCATTACAG 


ATCCAACTAA 


29640 




TGGTTCAAAT 


GCGAATAAAG 


ACGCTGTAGA 


CCAAGTATTA 


ACTAAGCTTC 


AAGAAAAAGA 


29700 


45 


AAATGAGTTA 


AATGGTAATG 


AGAGAGTCGC 


TGAAGCTAAA 


ACACAAGCGA 


AACAAACTAT 


29760 




TGACCAATTA 


ACACATTTAA 


ATGCTGATCA 


AATTGCAACT 


GCTAAACAAA 


ACATTGATCA 


29820 




AGCGACGAAA 


CTTCAACCAA 


TTGCTGAATT 


AGTAGATCAA 


GCAACGCAAT 


TGAATCAATC 


29880 


SO 


TATGGATCAA 


TTACAACAAG 


CAGTTAATGA 


ACATGCTAAC 


GTTGAGCAAA 


CTGTAGATTA 


29940 




CACACAAGCA 


GATTCAGATA 


AACAAAATGC 


TTATAAACAA 


GCTATTGCTG 


ATGCTGAAAA 


30000 
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10 



16 



20 



25 



30 



35 



40 



TGCAAAACAA GCATTAAATG GTGATGAACG TGTAGCACTT 
TGACATCGAC CAATTGAATG CATTAAACAA TGCTCAACAA 
CGATCAATCA AACGATTTAA ATCAAATCCA ACAAATTGTA 
TCGTGCAATG GATCAATTGT CACAAGAAAT CACTGACAAT 
CACGAACTAT GTCAATGCAG ATACACAAGT CAAACAAGTA 
AGCGAAACAA GCACTTGATA AATCGACTGG TCAAAACTTA 
ATTAAATGAT GCAGTCACTG CAGCTAAGAA AGCATTAAAT 
TCGTAAAGCT GAAGCATTAC AAAGATTGGA TCAATTAACA 
ACAATTAGCA ATCCAACAAA TTAATAATGC TGAAACGCTA 
TAATAGAGCA ACTAAATTAG ATAATGCAAT GGGTTCAGTA 
GCACCTTGGT GTTATCAGCA GCACAAATTA CATCAATGCA 
TTATGATAAT GCAATTGCGA ATGCAGCACA TGAGTTAGAT 
TGCaAAAGCT GAAGCAGAGC AATTGAAACA AAATATTATC 
TGGAGACCAA AACCTTGCAA ATGCCAAAGA TAAAGCAAAT 
TGGATTAAAT CAACAGCAAC AAGATCTTGC ACATAAAGCA 
ATCAGATGTA ACAGATATTG TTAATAATCA AATTGACTTA 
GAAACATTTA GTTGACAATG AAATTCCAAA TGCAGAGCAA 
TGACGATAAT GCTAAA 

<2) INFORMATION FOR SEQ ID NO: 60: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2243 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY : linear 



GCTAAAACAA ATGGTAAACA 30120 

GATGGATTTA AAGGTCGCAT 30180 

GATGAGGCTA AGGCACTTAA 30240 

GAAGGACGCA CGAAAGGTAG 30300 

TATGATGAAA CGGTTGATAA 30360 

ACTGCAAAAC AAGTTATCAA 30420 

GGTGAAGAAA GACTTAATAA 3 0480 

CATCTAAACA ATGCTCAAAG 30540 

AATAAAGCAT CTCGAGCAAT 306OO 

CAACAATATA TTGACGAACA 30660 

GATGACAATT TGAAAGCAAA 30720 

AAAGTGCAAG GTAATGCAAT 3 0780 

GATGCTCAAA ATGCATTAAA 30840 

GCGTTTGTTA ATTCGTTAAA 3 0900 

ATTAACAATG CCGATACTGT 30960 

AATGATGCAA TGGAAACATT 31020 

ACTGTCAATT . ACCAAAACGC 31080 

31096 



45 



SO 



Cxi) SEQUENCE DESCRIPTION: SEQ ID NO: 60: 

ATGACAGAAT GGGAGCGAGG ACTTAGAATG TTTCCTAAAT CAGGTTTATT AAATTTTGAG 60 

TTAGCGATAG mAAATCGTTC ATTAAATGAT GATGAAAAAG CATTAAAATA TGTGCGTAAA 120 

GCATTAAATG CAGACCCTAA AAATACAGAT TATATTAACT TAGAAAAAGA GTTGACTAAA 1B0 

TCAAATGAGT CGAAAAATAA ATAACTTTTA TGATGTACAA CAGTTATTGA AAAGTTACGG 240 

ATTTCTAATA TATTTTAAAA ATCCAGAAGA TATGTACGAA ATGATTCAAC AGGAGATTTC 300 
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TAATCAGAGA AGGAATGAAC AGAAATGACA AAAATTATTT TAGCAGCTGA TGTAGGCGGG 420 

ACGACTTGTA AATTAGGTAT TTTCACACCT GAATTAGAAC AATTACATAA ATGGTCTATT 4 80 

5 CACACTGATA CATCTGATAG TACAGGATAT ACACTTTTGA AAGGAATTTA TGATTCGTTT 54 0 

GTTGAAAAAG TAAATGAAAA TAATTATAAT TTTTCAAATG TACTTGGCGT AGGTATTGGT 600 

GTACCAGGTC CTGTTGACTT TGAAAAAGGT ACAGTAAATG GAGCAGTAAA CTTATATTGG 66 0 

10 

CCAGAAAAAG TTAATGTACG TGAGATTTTT GAACAATTCG TTGATTGTCC AGTGTATGTA 720 

GATAATGATG CTAACATAGC TGCTTTAGGG GaGAAACACA AAGGTGCTGG TGAAGGTGCC 780 

is GATGATGTTG TTGCCATCAC ACTTGGTACA GGTCTAGGTG GAGGAATTAT TTCCAAATGG 840 

TCAAATCGTA CATGGTCATA ATGGCTCtGG CGCAGAAATA GGTCATTTTA GAgCAGACTT 900 

CgATCAACGA TTTaAATGTA ATTGTGGTCG TTCTGGATGT ATTGAAACAG TTGCTTCaGC 960 

20 GACAGGCGTT GTTAACTTAG TTAACTTCtA CTATCCGAAG TTGACGTTTA GATCTTCTAT 1020 

ATTAGAATTG ATTAAAGAAA ATAAGGTtAC aGCAAAAGCT GTTTTTGATG CGGCAAAAGC 1080 

TGGTGACCAA TTCTGTATTT TCATTACTGA AAAGGTTGCA AACTATATTG GATATTTATG 114 0 

25 TAGTATTATT AGTGTTACAA GTAATCCGAA ATATATCGTT CTAGGTGGAG GAATGTCTAC 1200 

TGCAGGACCT ATTTTAATTG AAAATATTAA AACAGAATAT CATAATTTAA CATTTGCACC 1260 

TGCTCAATTT GAAACTGAAA TTGTACAAGC GAAATTAGGT AATGATG CAG GTATTACAGG 132 0 

AGCAGCAGGA TTAATCAAGA CCTATGTATT AGATAAAGAG GGGGTAAAAT AATGGCTATT 13 80 

GTTGATGTGG TTGTTATTCC AGTTGGAACG GAAGGTCCGA GTGTTAGTAA ATATATTGCA 1440 

GATATTCAGA AAAAACTTCA AGAATATAAA GCAATGGGTA AAATTGATTT TCAATTAACA 1500 

35 

CCAATGAATA CTCTAATTGA AGGTGAATTA AGCGATGTAT TAGAAGTTGT GCAAGTGATA 1560 

CATGSATTAC CTTTTGATAA AGGTTTAAGT AGAGTTTGTA CAAATATCCG TATTGATGAC 1620 

CGACGAGACA AATCTAGAAA AATGAATGAT AAACTAACAT CAGTACAAAA ACATTTAGAA 1680 

40 

AATAGTGGTG AAAACCTATG AGGATTTCAA GCTTAACTTT AGGCTTAGTT GATACTAATA 1740 

CGTATTTCAT CGAAAATGAC AAAGCTGTTA TTCTGATTGA CCCTTCAGGT GAAAGTGAAA 1800 

45 AAATTATTAA AAAATTAAAC CAAATAAATA AACCGTTAAA AGCTATTTTA TTAACACATG 1860 

CACACTTTGA TCATATCGGA GCAGTCGATG ATATAGTTGA TCGATTCGAT GTCCCGGTTT 1920 

ATATGCATGA AGCAGAGTTT GATTTTCTAA AAGATCCCGT TAAAAATGGG GCAGATAAAT 1980 

SO TTAAGCAATA TGGATTACCA ATTATTACAA GTAAGGTAAC TCCTGAAAAG TTAAmCGAAG 2040 

GTAGCACAGA AATAGAAGGA TTTAAGTTnT nAyrTGTaCA CACACCTGGA CATTCACCAG 2100 
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GAATCGGACG TACAGATTTA TATAAAGGTG ATTATGAAAC GCTAGTTGAT TCTATTCAAG 2220 
ATAAAATATT TGAATTAGAA GGC 2243 
(2) INFORMATION FOR SEQ ID NO: 61: 

<i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 8009 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 61: 



15 


TTGGnATCAT 


tyAcgGTAAA 


AAGAATAAaG 


CAAGATTtAT 


TTCATTAGTA 


CTAATTTGTG 


60 




CAATGTTTGC 


AATTTGTTGG 


GTTG CAT AT A 


TTCAATGGGA 


GTCTACAATC 


GCTTCATTTA 


120 


Ofi 


CACAATCTAT 


TAATATTTCa 


ATGGCACAAT 


ATAGTGTTTT 


ATGGACAATT 


AACGGAATAA 


180 




TGATTTTAGT AGCACAACCA 


TTAATTAAAC 


CGATTCTCTA 


TCTGTTAAAA 


GGAAACTTAA 


240 




AGAAGCAAAT 


GTTTGTCGGC 


ATCATCATTT 


TTATGTTGTC 


GTTCTTTGTC 


ACGAGTTTTG 


300 


25 


CCGAAAACTT 


TACAATATTT 


GTTGTCGGTA 


TGATTATTTT 


AACTTTTGGA 


GAAATGTTTG 


360 




TATGGCCAGC 


AGTTCCAACT 


ATAGCCAATC 


AGTTAGCGCC 


AGATGGTAAG 


CAAGGACAGT 


420 




ACCAAGGTTT 


TGTGAATTCA 


GCTGCTACAG 


TAGGAAAAGC 


ATTTGGTCCA 


TTTCTTGGTG 


480 


30 


GTGTATTAGT 


TGATGCGTTT 


AATATGCGCA 


TGATGTTTAT 


CGGTATGATG 


. CTACTACTTG 


540 




TATTTGCATT 


AATATTATTA 


ATGGTTTTCA 


AGGAGAATAA 


TACGCAACCT 


AAAAAAATAG 


600 




ATGCATAATG 


AGTAAATAGA 


ATTAACGTTA 


TAGACTTGAA 


ATAAATGTCG 


TTATAACATA 


660 


35 


ATATTAATTT 


GTATAATTTA 


ATTTCGTTTG 


GAG CTTTTCT 


ACAGAAAGCT 


AGTGATGCTG 


720 




AGAGCTAGTG 


TTAAGGACTA 


AATGTAAATC 


GTATTAATTT 


TAAATTGAAT 


GAATGACATC 


780 


40 


TCTTACTATT 


AAAATGAGTG 


CACAATTTTT 


GTGAAATAGG 


GTGGTAACGC 


GGCAAATGTC 


840 


GTCCCTATGT 


AAATAGAATA 


GTTAGAGGTG 


TCTTTTTTAT 


TGAATAGGAG 


GAAATGTGTT 


900 




GAATTACAAC 


CACAATCAAA 


TTGAAAAGAA 


ATGGcAAGAC 


TATTGGGACG 


AAAATAAAAC 


960 


45 


ATTTAAAACA 


AATGATAACT 


TAGGTCAAAA 


GAAATTTTAT 


GCTTTAGACA 


TGTTTCCATA 


1020 




TCCATCAGGT 


GCTGGTTTAC 


ATGTTGGACA 


TCCTGAGGGC 


TATACAGCAA 


CAGATATCAT 


1080 




TTCAAGATAT 


AAAAGAATGC 


AAGGATATAA 


TGTATTACAT 


CCGATGGGGT 


GGGATGCATT 


1140 


SO 


CGGATTACCA 


GCAGAGCAAT 


ATGCTTTAGA 


CACTGGCAAC 


GACCCACGTG 


AATTTACAAA 


1200 




GAAAAATATC 


CAAACTTTTA 


AACGACAAAT 


TAAAGAATTA 


GGGTTCAGTT 


ATGATTGGGA 


1260 



SS 
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GTTATATAAC AAAGGTTTAG CATACGTTGA 
AGGCACTGTT TTATCTAACG AAGAAGTGAT 
5 AGTTTATCGT AAGCCGATGA AACAATGGGT 

ATTAGCAGAT TTAGATGATT TAGATTGGCC 
GATTGGACGT TCTGAAGGGG CCAAAGTTTC 

10 

AGAAGTATTT ACGACTAGAC CAGATACAAT 
TGAACATGCA TTAGTTAATT CAATTACAAC 
TCAAACAGAA GCTTCTAAAA AGTCAGATTT 

15 

AGGTGTATTT ACTGGTGCAT ATGCAACTAA 
GATTGCTGAT TATGTATTAT CAACATATGG 

20 TGATGACAGA GATTATGAAT TTGCTAAAAA 

AGGTGGAAAT GTTGAAGAAG CAGCATACAC 
ACTTGATGGT TTAGAAAATG AAGCGGCAAT 

25 AGGTGCTGGC GAAAAGAAAG TTAATTACAA 

TTATTGGGGC GAACCAATTC CTGTCATTCA 
TGAAGAAGAG CTACCATTGT TGTTACCTGA 

30 TGAGTCTCCA CTAGCTAATA TTGATTCATT 

GAAAGGACGT CGTGAAACAA ATACAATGCC 
ACGTTAGATC GATCCTAAAA ATGAAAATAT 

35 

GTTACCTGTT GATTTATATA TCGGTGGAGT 
AAGATTTTGG CATAAAGTCC TTTATGATTT 
AAAATTATTT AACCAAGGTA TGATTTTAGG 

40 

AGGAAATGTA ATCAATCCTG ATGATATAGT 
TTACGAAATG TTTATGGGAC CTTTAGATGC 

4S TGGGTCTCGT CGATTCTTAG ATCGCGTATG 

GAGTTCAAAA ATTGTAACTA CAAATAATAA 
TAAAAAGGTA ACAGAAGACT TTGAAACATT 

50 GGTATTTATT AATGAGTGTT ATAAAGTTGA 

CGTTAAAATG TTAGCACCTA TTGCACCACA 

55 



TGAAGTTGCA GTTAACTGGT GTCCAGCATT 1380 

TGATGGTGTC TCTGAACGTG GTGGACATCC 1440 

ACTTAAAATC ACAGAATATG CAGATCAATT 1500 

TGAGTCTTTA AAAGATATGC AGCGCAATTG 1560 

ATTTGATGTA GATAATACGG AAGGAAAAGT 1620 

CTATGGTGCA TCATTCTTAG TCTTAAGTCC 1680 

AGATGAATAT AAAGAAAAAG TAAAAGCTTA 1740 

AGAACGTACA GATTTAGCAA AAGATAAATC 1800 

TCCTTTATCT GGTGAAAAAG TACAAATTTG 1860 

TACTGGAGCA ATTATGGCAG TACCAGCGCA 1920 

GTTTGATTTG CCAATCATTG AAGTCATCGA 1980 

TGGTGAAGGT AAACATATTA ATTCTGGTGA 2040 

TACTAAAGCT ATTCAATTAT TAGAGCAAAA 2100 

ATTAAGAGAT TGGTTATTCA GTCGTCAGCG 2160 

TTGGGAAGAT GGAACAATGA CAACTGTTCC 2220 

AACAGATGAA ATCAAGCCAT CAGGGACTGG 2280 

TGTAAATGTT GTAGATGAAA AAACAGGTAT 234 0 

ACAATGGGCA GGTAGTTGTT GGTATTATTT 24 00 

GTTAGCAGAT CCTGAAAAAT TAAAACATTG 24 60 

AGAACATGCG GTTCTTCACT TATTATATGC 2520 

GGCTATCGTA CCTACTAAAG AACCTTTCCA 258 0 

AGAAGGTAAT GAGAAGATGA GTAAATCTAA 264 0 

ACAGTCTCAT GGTGCAGATA CTTTGCGTCT 2700 

TGCAATTGCA TGGAGTGAAA AAGGATTAGA 276 0 

GCGTTTAATG GTAAATGAAG ATGGGACATT 2 820 

ATCTTTAGAT AAAGTTTATA ACCAAACTGT 2880 

AGGATTTAAT ACTGCTATTA GTCAATTAAT 294 0 

TGAAGTTTAT AAACCTTACA TTGAAGGCTT 3000 

TATCGGTGAA GAATTATGGT CAAAATTAGG 3060 
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TGATGAAGTA GAAATCGTTG TTCAAGTGAA TGGTAAATTG AGAGCTAAAA TTAAAATTGC 3180 

TAAAGATACA TCAAAAGAAG AAATGCAAGA AATTGCCTTA TCTAATGACA ATGTTAAAGC 3240 

GAGTATTGAA GGTAAAGACA TCATGAAAGT CATCGCTGTT CCTCAAAAAT TAGTCAATAT 3300 

TGTAGCTAAA TAATGTTTTA AGGAGGACTT TGAAATGAAG TCAATTACTA CAGATGAATT 3360 

AAAAAATAAA CTTTTAGAAT CTAAACCAGT TCAAATTGTT GATGTTCGTA CTGATGAAGA 3420 

AACAGCAATG GOATATATTC CTAATGCAAA GTTAATTCCA ATGGATACCA TTCCGGATAA 3480 

TTTAAATTCA TTTAATAAAA ATGAAATATA TTATATTGTA TGTGCTGGTG GAGTTCGAAG 3540 

CGCTAAAGTT GTAGAATATT TAGAGGCAAA TGGCATTGAT GCCGTAAATG TCGAAGGCGG 3600 

CATGCACGCA TGGGGCGATG AAGGTTTGGA AATAAAAAGT ATTTAAAGTA GTGACATAAT 3660 

TTAAAATAAT ATTACATTTG TAATGACACC AAGTAACGTT TCGGTTGCTT GGTGTTTTTT 3720 

GGTATGAATT ACTTTCTGTT ACAAAACAAT CTAAAGCGTT CTTGTTATGT TTTATTAAGA 3780 

TTTTAATTAC AAAACGGAAA CTAAATTGTA ATAAAATAAA ACTTTATTTT ATAAAATGAT 3840 

GATGATAAAA TTGAGTGAAC TTAAAATATT GTACAAAATA AT AT AG CT AT AAATATAATA 3900 

25 TAGCTATAAA TATAATATGA GGGAGCGTAT ATTTTTAGCA TAATTCTTAA CAACACAGCA 3960 

GAGAACAGAC AACCAGGAGG AAAATGAAAT GAATTTGTTA AAGAAAAATA AATATAGTAT . 4020 

TAGGAAGTAT AAAGTAGGCA TATTCTCTAC TTTAATCGGA ACAGTTTTAT TACTTTCAAA 4080 

30 . CCCAAATGGT GCACAAGCCT TAACTACGGA TAATAATGTA . CAAAGCGATA . CTAATCAAGC 4140 

AACACCTGTA AATTCACAAG ATAAAGATGT TGCTAATAAT AGAGGTTTAG CAAATAGTGC 4200 

GCAGAATACA CCTAATCAAT CTGCAACAAC CAATCAAGCA ~ ACGAATCAAG CATTGGTTAA 4260 

TCATAATAAT GGTAGTATAG TAAATCAAGC TACGCCAACA TCAGTGCAAT CAAGTACGCC 4320 

TTCAGCACAA AACAATAATC ATACAGATGG CAATACAACA GCAACTGAGA CAGTGTCAAA 4380 

CGCTAATAAT AATGATGTAG TGTCGAATAA TACCGCATTA AATGTACCAA CTAAAACAAA 4440 

TGAAAATGGT TCAGGAGGAC ATCTAACTTT AAAGGAAATT CAAGAAGATG TTCGTCATTC 4500 

TTCAAATAAA CCAGAGCTAG TTGCAATTGC TGAACCAGCA TCTAATAGAC CGAAAAAGAG 4 560 

AAGTAGACGT GCGGCACCGG CAGATCCTAA TGCAACTCCA GCAGATCCAG CGGCTGCAGC 4620 

GGTAGGAAAC GGTGGTGCAC CAGTTGCAAT TACAGCGCCA TATACGCCAA CAACTGATCC 4680 

TAATGCCAAT AATGCAGGAC AAAATGCACC TAACGAAGTG CTGTCATTTG ATGACAATGG 4740 

50 TATTAGACCA AGTACCAACC GTTCTGTGCC AACAGTAAAC GTTGTTAATA ACTTGCCGGG 4 800 

CTTCACACTA ATCAATGGTG GCAAAGTAGG GGTGTTTAGT CATGCAATGG TAAGAACGAG 4 860 
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TCGTATACAT 


GGAACTGATA 


CGAATGACCA TGGCGATTTT 


AATGGTATCG 


AGAAAGCATT 


4980 




AACAGTAAAT 


CCGAATTCTG 


AATTAATCTT 


TGAATTTAAT 


ACAATGACTA 


CTAAAAACGG 


5040 


5 


TCAAGGCGCA 


ACAAATGTTA 


TTATCAAAAA 


TGCTGATACT 


AATGATACGA 


TTGCTGAAAA 


5100 




GACTGTTGAA 


GGCGGTCCAA 


CTTTGCGTTT 


ATTTAAAGTA 


CCTGATAATG 


TGAGAAATCT 


5160 




CAAAATTCAA 


TTTGTACCTA 


AAAATGACGC 


AATAACAGAT 


GCGCGTGGCA 


TTTATCAACT 


5220 


10 


AAAAGATGGT 


TACAAATACT 


ATAGCTTTGT 


TGACTCTATC 


GGACTTCATT 


CTGGGTCACA 


5280 




TGTTTTTGTT 


GAAAGACGAA 


CAATGGATCC 


AACAGCAACA 


AATAATAAAG 


AGTTTACFGT 


534 0 


IS 


AACAACATCA 


TTAAAGAATA ATGGTAATTC 


TGGTGCTTCT 


CTAGATACAA 


ATY3APTTTY5T 




ATATCAAGTT 


CAATTACCTG 


AAGGTGTTGA ATATGTGAAC 


AATTCATTGA 


V> A. flf\n\3*X X 1 1 






TCCAAGTAAC 


AATTCAGGCG 


TTGATGTTAA 


TGATATGAAT 


GTTACATATG 






20 


TCGTGTGATA 


ACAATTAAAA 


GTACTGGAGG 


AGGTACAGCA 


AACTCTCCGG 


CACGACTTAT 






GCCTGATAAA ATACTCGATT 


TAAGATATAA 


ATTACGTGTA AATAATGTGC 


CGACACCAAG 


5640 




AACAGTAACA 


TTTAACGAGA 


CATTAACGTA 


TAAAACATAT 


ACACAAGATT 


TCATTAATTC 


5700 


25 


AGCTGCAGAA 


AGTCATACTG 


TAAGTACAAA 


TCCATATACT 


ATCGATATCA 


TCATGAATAA 


5760 




AGATGCATTA 


CAAGCCGAAG 


TTGACAGACG TATTCAACAA GCTGATTATA CATTTGCGTC 


5820 




ATTAGATATC 


TTTAATGGTC 


TGAAACGACG 


CGCACAAACG 


ATTTTAGATG 


AAAATCGTAA 


5880 


30 


CAATGTACCA 


TTAAATAAAA 


GAGTTTCTCA 


AGCATATATT 


GATTCATTAA 


CTAATCAAAT 






GCAACATACG 


TTAATTCGAA 


GTGTTGATGC 


TGAAAATGCA 


GTTAATAAAA 


AAGTTGACCA 


6000 




AATGGAAGAT 


TTAGTTAATC 


AAAATG ATG A 


ATTGACAGAT 


GAAGAAAAAC 


AAGCAGCAAT 


d Ub U 


35 


ACAAGTTATC 


GAGGAACATA 


AAAATGAAAT 


AATTGGTAAT 


ATTGGTGACC 


AAACGACTGA 






TGATGGCGTT 


ACT AGAAT CA 


AAGATCAAGG 


TATACAGACC 


TTAAGTGGGG 


ATACTGCAAC 


i ft n 


40 


ACCGGTTGTT 


AAACCAAATG 


CTAAAAAAGC 


AATACGTGAT 


AAAGCAACGA 


AACAAAGGGA 


6240 


AATTATCAAT 


GCAACAC CAG 


ATGCTACTGA 


AGACGAGATT 


CAAGATGCAC 


TAAATCAATT 


6300 




AGCTACGGAT 


GAAACAGATG 


CTATTGATAA 


TGTTACGAAT 


GCTACTACAA 


ATGCTGACGT 


6360 


45 


TGAAACAGCT 


AAAAATAATG 


GCATCAATAC 


TATTGGAGCA 


GTTGTTCCTC 


AAGTAACTCA 


6420 




TAAAAAAGCT 


GCAAGAGATG 


CAATTAACCA 


AGCAACAGCA 


ACGAAAAGAC 


AACAAATAAA 


6480 




TAGTAATAGA 


GAAGCAACTC 


AGGAAGAGAA 


AAATGCAGCA 


TTGAACGAAT 


TAACTCAAGC 


6540 


SO 


AACCAACCAT 


GCTTTAGAAC 


AAATCAATCA 


AGCAACAACA 


AATGCTAATG 


TTGATAACGC 


6600 




CAAAGGAGAT 


GGTCTAAATG 


CCATTAATCC 


AATTGCTCCT 


GTAACTGTTG 


TTAAGCAAGC 


6660 



ss 
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TGATGCGACT CAAGAAGAAA GACAAGCAGC AATTGACAAA GTGAATGCTO CTGTAACTOC 6780 

AGCAAACACA AACATTTTAA ACGCTAATAC CAATGCTGAT GTTGAACAAG TAAAGACAAA 6840 

5 TGCGATTCAA GGAATACAAG CAATTACACC AGCTACAAAA GTAAAAACAG ATGCAAAAAA 6900 

TGCCATCGAT AAAAGTGCGG AAACGCAACA TAATACGATA TTTAATAATA ATGATQOGAC 6960 

GCTCGAAGAA CAACAAGCAG CACAACAATT ACTTGATCAA GCTGTAGCCA CAGCGAAGCA 7020 

10 

AAATATTAAT GCAGCAGATA CGAATCAAGA AGTTGCACAA GCAAAAGATC AGGGCACACA 7080 

AAATATAGTA GTGATTCAAC CGGCAACACA AGTTAAAACG GATACTCGCA ATGTTGTAAA 7140 

TGATAAAGCG CGAGAGGCGA TAACAAATAT CAATGCTACA ACTGGCGCGA CTOGAGAAOA 7200 

75 

GAAACAAGAA GCGATAAATC GTGTCAATAC ACTTAAAAAT AGAGCATTAA CTGATATTGG 7260 

TGTGACGTCT ACTACTGCGA TGGTCAATAG TATTAGAGAC GATGCAGTCA ATCAAATCGG 7320 

CGCAGTTCAA CCGCATGTAA OGAAGAAACA AACTGCTACA GGTGTATTAA ATGATTTAGC 7380 

20 

AACTGCTAAA AAGCAAGAAA TTAATCAAAA CACAAATGGA ACAACTGAAG AAAAGCAAGT 7440 

GGCTTTAAAT CAAGTGGATC AAGAGTTAGC AACGGCAATT AATmATATAA ATCAAGCTGA 7500 

25 TACAAATGCG GAAGTAGATC AAGCGCAACA ATTAGGTACA AAAGCAATTA ATGCGATTCA 7560 

GCCAAATATT GTTAAAAAAC CTGCAGCATT AGCACAAATC AATCAGCATT ATAATGCTAA 7620 

ATTAGCTGAA ATCAATGCTA CACCAGATGC AACGAATGAT GAGAAAAATG CTGCGATCAA 7680 

30 TACTTTAAAT CAAGACAGAC AACAAGCTAT TGAAAGTATT AAACAAGCTA ACACAAATGC 7740 

AGAAGTAGAC CAAGCTGCGA CAGTAGCAGA GAATAATATC GATGCTGTTC AAGTTGATGT 7 800 

AGTAAAAAAA CAAGCAGCGC GAGATAAAAT CACTGCTGAA GTGGcGAacG TATTGaAGCG 7 860 

35 GTTAAACAAA CACCTAATGC AACTGACGAA GAAAAGCAGG CTGCTGTTAA TGAAATCCAA 7920 

TCAACTTTAA AGATTCAAGC AATTTAATCC AAATTTAATC CAAAACCCAA ACAAATGGAT 7980 

TCAGGGTAGG ACACCACTTA CAAATCCAA 8009 

40 

(2) INFORMATION FOR SEQ ID NO: 62: 

<i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 10953 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 

50 <xi) SEQUENCE DESCRIPTION: SEQ ID NO: 62: 

ACCCACCCCn TGGGGATAnT TTACCTGGTG GGGCCTTCGA TTGCCTTTAG GTGAAACCaG 60 
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AGATGAATGC 


TAACCATATT 


CATTCTGCTA AAGATGGTCG 


TGTTACTGCG 


ACAGCTGAAA 


180 




TTATTCATCG 


AGGTAAGTCG 




wjOATATAAA 


AATTAAGAAT 


GACAAAGAAC 


240 


s 


AATTAATTAC 


AGTTATGCGT 


flf3T A C Af3 TTC 


<- IA1 1 AAACC 


TTTAAAATAA 


AAGAACTGCT 


300 




AGCTGAAATG 


TTATGAGATA 




CAiG (JT AG CAG 


TTTTTTTATG 


CGCTATATTG 


360 




TTGTAGTTTT 


AGAAATGCTT 




TTCGGCAGCT 


TTACGGCCAC 


CCATAACATT 


420 


10 


TCTACCAAAT 


GGTCCTAATT 


CTAAGTCTG C 


AAAGCATCCT 


GCGACAAATA 


GATTTGGTAT 


480 




CCATTCTAAT 


TTTTCGGAAA 


TAACAGGGTA 


ATTACATTCG 


TTGATAGGTG 


CATCATAATT 


540 


15 


TTGTATTAAT 


TGCTTAATAA 


GTGGTTGTGA 


CATAAAATCT 


TGTTCAAAAC 


CAGTTGCAAC 


600 


CATAATCTGT 


TGATATGGAA 


CAGAATCATT 


TTCAGTGTTA 


ATTACACCAC 


CACTAATTTG 


660 




AGTCATAGGT 


GTTTTATGCa 


CATTTATACG 


ACCATTTTTA 


ATATGTTTTT 


TAAGGCGTAA 


720 


20 


GTACAGTTCG 


TGAGGCATTG 


ATCCTTTATG 


ACGTTCGCGT 


TGTACAATGG 


CATTTCTTTC 


780 




AGGCATGCTT 


TTAGTACTTA 


AAAATGAAGA 


CATATTTTTC 


GGACCTAACC 


AACCAGGATC 


840 




AGCATCAAAG 


TCATGTATTT 


CAATATCTTT 


ATTTAGCCAT 


AAATGAATCT 


TTTTATCGTT 


900 


25 


ATCATGATTT 


AACAATTTAA 


GTGCAAGATG 


TGCAGCAGTa 


ATGCCGCTAC 


CAACGATATG 


960 




ATCGGTCTTA 


TCATATACTA 


CTTGATCAAG 


TTCTTTCTCG 


AAGATATGAT 


TTACATTCTG 


1020 




TTTGTCTTTT 


AAAATGTCAG 


GCATAAACGG 


AATATTTGTA 


CTGCCTATTG 


CAATAACGAC 


1080 


30 


GCAATCTGTA 


GTGATAATTT 


GTCCATCTTC 


TAACTTGATA 


TGCCATTTGT 


CTTCTTGTTT 


1140 




ATCTAAAGTT 


TGAACTAAAC 


CTTGAACCAA 


GCAATCCTCT 


AATTGATATT 


GTTTAGAAGC 


1200 




ATGTGCAATA 


TGATCCATAA 


ACATTGTCAA 


TTCAGGTCGT 


TGATAAGGAC 


CATAAAAAGC 


1260 


35 


ATTTGTATAT 


TGGTGCTGTT 


TAG CG AATTG 


TTTTAGATGG 


AACGGTTGTG 


GATGTACGTG 


1320 




ATGTACAATC 


GGTGATCTTA AATAAGGCAT 


TTCTATTCGA 


TTTGTATATG 


AGTTAAACCT 


1380 


40 


TTGGCAAAAA 


GTTTCGTGTG 


GGTCAATGAT 


TGTTAATCGG 


TCTGTTGTTA 


ATCCGCTTGA 


1440 


TAATAGTTTT 


TGTGCGATTG 


CAGTTCCCTG 


TATGCCACCG 


CCGATAATTG 


TCCAATGCAT 


1500 




AATAAAACCT 


CTCTCTTTTT 


AAAACGTAAT 


AGTTAOGATT 


TATAATTATT 


ATT AT CAT AA 


1560 


45 


TACATAACGA 


CATGAAAGGC 


AATTAAATTA 


AAGAGATATA 


TGTAGATAGG 


GCGAATCTGT 


1620 




AGTCAAAGAA 


AAAATCATTG 


AAAAAGAGGT 


AACAATGTCA 


AAAGAwAACA 


GCAGTAAAAT 


1680 




CATTCCTAAT 


TTGGAATCAT 


CTTACTGCTG 


TTTGTTGTTG 


ATTTATATTC 


ATGATTTTGT 


1740 


50 


TATATAATCT 


ACAATTTTGT 


GTCTTTTAAG 


TCTTCCGAAA 


TTTCATCGAC 


TTTAGTCTTT 


1800 




TTAGTATAAG 


GCGTTTTAAT 


ATTATATGCT 


GCTTTCATAA 


TCATATGACT 


TGAAAGAGGA 


1860 
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GCAATAAAAT 


ATAAAAACGT ACCAAATAGT AATGACATTG 


WlVC X AA i\7 i 


iwlluv*! X X X 


1 AAA 

1 S oU 




CCGGCAGCAT 


GTGCACGTGA 


ATATACATCT 


TCAAGTCTCA 


ATAATCCTAT 


AW* X vJ l« X nUVj 




6 


GCGCTAATTA 


AAGCACCGAT 


GATAACAAAG 


ATAAGTGCAA 


V A w X AA 1 ^AV9 


InlUnl X X 1U 


*> 1 Art 




ATCATGTTCA 


ATCACCTTAC 


CTTTGTCCAT 


AAATTTAGAG 


AA X Aw X OVvAVJ 


1AV.L1AAAAA 




10 


AG CTAATATA 


CCAATCATCA 


TAATAACGAC 


AATCATGTAT 


TTAATATTTA 


ATAAAATACT 




GAATAATGCT 


ATAACTGCCA 


TTAATTGAAG 


ACCAATCGCA 


TCTAATGCGA 


CAACACGATC 


2280 




GGCAAGTGAT 


GGGCCTAGCA 


CAACGCGAAT 


GAGCATAGCT 


AACATAGAAA 


TGACAACTAT 


2340 


15 


GATTAATGCA 


ATAACGATAA 


TAACATTATG 


ATTCATTATA 


TTTCGCCCAC 


CTCTCTTACA 


2400 


ATTTTCTCTA 


ATGATGTTTT 


AATACTTTCT 


ACTTCTTGCT 


CTTTAGTTGA AAAATCTATG 


2460 




GCATGAATAT AAATTTTTGT 


ACGATCGTCA 


CTTACACCAA 


GCACTACAGT 


ACCAGGTGTT 


2520 


20 


AATGTAATTA 


AATTAGACAG 


CAAGACAATT 


TGCCAATCTT 


TTTTTAAATC 


TGTGTGATAA 


2580 




ACAAAGLAATC 


CTGGTTCATT 


TTTAATCGAA 


GGTTTAATAA 


TAATTTTCAA 


AACATCAAAA 


2640 




TTAGCTTTAA 


TCAGTTCGAT 


TAAGAAAATA 


ATAACTAATT 


TAATAATACG 


ATATAGCGTG 


2700 


25 


A JAjlA\— A X AAA 


ATCTACCTGG 


TAACACTCTG 


TGTAAGAGGT 


AAACAAGAAC 


TAGGCCAAAG 


2760 




ATGAAACCTA 


ACACAAAGTT 


ATTTGTTGTG 


TAACTATTTG 


TCACAAACAA 


CCAAAACaCT 


2820 




GCGATAATAA 


AGTTTAATAC 


TAATTGTACA 


G C CATGTTAT 


TTACCTCCTA 


ATACAGCTTT 


2880 


30 


AACGTAGGTT 


GATGGATTGT 


AGAATGTTTC 


TGCACCAGCT 


TTTACCATTG 


GATATAAGTA 


2940 




ATCTGCTGAC 


AATCCATATA AAACAGTTAT 


CACAACTGCA 


ACGATTGCAA 


TCGTAGTTAA 


3000 


35 


ATATTTGACG 


TCGACTTTGT 


TATTAAGATC 


ATATCCTTTT' 


GGTTGACCGA 


AAAAGCCTTG 


3060 


TAGGAATATG 


CGAATGACAG 


AATATAATAC 


GACTAAACTT GATAATAAGA 


CGATGACACC 


3120 




ACTTAAATAA 


AATCCTCTTT 


CaAATGTTGA 


TTGGACAATA 


AAAAATTTTC 


CATAAAAGCC 


3180 


40 


ACTGAGTGGG 


GGAATGCCAG 


CTAAACTTAA 


TGCTGCGATA 


AAGAATGACC 


AACCAAGTAC 


3240 


AGGATATCGT 


TTAATTAAGC 


CACCAAATTG 


TCTTAAATCA 


GCAGTGCCTG 


TAATTTTAAT 


^ 1 ft ft 




CATAATTCCG 


ATAAGCAAGA 


ATAATGCAAG 


TTTTACTAAC 


ATGTCGTGCA 


ATGTATAGTA 


3360 


45 


AATAGCCCCA 


ATCATACCTG 


ACTCTGTCAT 


CATTGCAACG 


CCGACTAAGA 


TCACACCTAC 


3420 




AGCAATCATG 


ACATTGTATA 


GGATGATTTT 


TTTAATGTTG 


GCATATGCAA 


CAGCACCGAC 


3430 




ACAACCAAAG 


ATGATCGTTA 


ATAGTGCTAA 


GAATAAAATG 


ACATAATGTG 


AAAAGCTTAC 


3540 


SO 


ATTATCACTA 


AAGAATAGGC 


TCAATGTTCT 


AGCGATTGCA 


TAAACACCAA 


CTTTTGTTAA 


3600 




CAAAGCACCA AAGAATGCAA TGATTGGAAT TGGTGGgCAT AGTATGCACT AGGTAACCAA 


3660 
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ATATTGACTA AGCCACTGTC ATGCQCTGAA AGGTTAGCTA ATTTATTGCT TATATCTGCT 3780 

AGATTCAATG TTCCTACTAC TGAATATAAA ATCGCTACAC CCATTACGAA GAAGGATGAC 384 0 

GATACAACGT TAACAAGAAC ATATTTTATT GTTTCTTGTA GTTGAATTTT TGTAGAACCA 390 0 

ATTACTAATA AGAAATAAOA TGACATTAAA AATACTTCGA AAAATACGAA TAGGTTGAAA 3960 

ATGTCACCAG TTGTGAATGC ACCAATGATA CCTATTAACA TAAATAGTAC TGAAAAATAA 4020 

TAATAATATC TTTCACGTTC AATACCAATT GTTTGGTATG AATATAAAAT CACAATAGCT 4080 

GTAATAATAA TACTAGTAAT TATTAGTAGG GCACTGAATA TGTCTAATAC AAAGACAATA 4140 

CTGTATGGTG CTTTCCATGA ACCTAGCTCT ACGCGTATTG GTCCATGTTT AACAACATTT 4200 

GCTAAATTGA TAATTGCCGC GACCAAGGTT AATAATGTAC CGCCTAGTGC GACATAACGC 4260 

TTTATAATAG GACGCTTTCC AATAAAGACA AGTAATATGG CTGTAATTAC TGGAATAACT 4320 

AGCGTTAACA CAAGCATATT ACTTTCAATC ATCTTCTGGA ACTCCTTTCA TACTCTCAAC 4380 

GTTATCTGTG CCTAATTCTT TATATGTTCT AAATGCTAAT ACTAAGAAAA AGGCTGTTGT 444 0 

CGCAAgGCGA TAACGATTGC TGTTAAAATA AGTGCTTGCG GGaTAGGaTC AACATAGCTT 4500 

25 TTTACGTTCG CTTCATAAAT TGGAACAGTA CCATGTTTAA GTCCGCCCAT AGTTATTAAA 4 560 

AATAAATTTG CTGCATGTGT TAATAGTGTA GTTCCCATAA CAATTCGTAT CAGACTTTTA 4 620 

GACAAAACGA GATAGACACT AATTGCTGTG AGAATACCAC TAACAAAAAT CATAATAATT 468 0 

30 TCCACTATTC GTTCTCTCCA ATCGAAATAA TAATTGTCAT GACAGTACCA ACTACTGCAC 474 0 

ATAAAACACC GAAATCAAAG AATACTGCTG TTGTCATATG AACAGGTTCT AATATAAATA 4800 

ACGGTATATC AAATGTGACA TGCGTAAAGA AATTTTTGCC TAAAAACCAA CTTGCGATAG 48 6 0 

GCGTCGGAAT ACAAAAAACT AATCCGATAC CTATCAAGAT TTTAAAATCT AATGGGAAAA 4920 

TTTTACGCAT TGTTTCTATA TCAAATGCAA TCGTAATGAT AACAAGTGAA CTTGCGAATA 4 9 80 

ATAATCCGCC GACGAAACCG CCACCAGGTG TATAATGTCC TGCTAAGAAA AGTGAAAAAC 504 0 

CAAAGACCAT TACCATGAAA AAGATAATAA CTGCAGCAAA TTGCAAAATT AGATCATTTT 5100 

GTTGTCTATT CATGATTTTT CAC CTCGTTA CCTTGCGTTT GACGCTTTTT ACGTAATTTA 5160 

ATCATTGTAT ATACAGCTAA TCCTGCGATA CCAAGCACAG ATGACTCGAA TAAAGTATCC 52 20 

ATACCACGGA AATCAACAAG TATGACGTTT ACCATGTTTT TACCGTGAGC tAAATCATAA 52 80 

ACGTGCTCTT GATAAAACTT AGATATCGAT TCAAAATGTC TATTTCCGTA TGCAATTAAA 5340 

CCGATAATAA TGACGGACAA ACCAACACCA CCAGCAATTA AAGCATTAGT AAGCTGGAAT 5400 

GAGCGCTTTT CATTATAACG ATTTAAATTT GGTAAGTGGT AGAAGCATAA TAAGAACAAT 54 60 



55 



35 



40 



45 



478 



EP0 786 519 A2 



ATAAACAATA CAGACACAGC ATATCCAACT GCACTTAACA TAATGATGCT AAATAATCTT 5580 

GATTTAGCGA AAAGAATTAA AAAGGCAGCA CTTAATAATA AAATTACGAT ACAAACTTCG 5640 

5 AAAATTCTAA TCGGACTAAC GTCTTTAAAA TTAATOTTGA AAOGTACTOA GAATATAGTG 5700 

ACAAATGTTA ATAAAATTAA TGCACCAAAA ATGATAACTA AATTATTACG TGAATAATCG 5760 

GTAACATAGC TATTCGTCAT CTTTTCAGAG TAGTTTGGAA TAACATTTGC ACTTCTGTTG 5820 

10 

TACCAATAAT TGAATGTTAG TTTACCAGGT TGTCGTTGCA ACAATTTCAC CCAATAACTA 5880 

AATGTCACAA TTAGTAAGAT ACCTAAAATA TAAATCACTA ATGTTGATAA AAAGGCAGGC 5940 

^ GTTAATCCAT GGAACATATG GAATTCAACA TCATCAATTA CCGTATGATT AATCGAAGag 6000 

TnAGCTGGTT CAATAATCGA ATTAGTTAAA ATGCCAGGGA ATAAACCAAA TACAATTACT 6060 

AATGTAGCTA AAATAGCTGG TGATAAAAGC ATTAATATTG ATACTTCGTQ TGCTTTTTTA 6120 

2q GGTAATTGTT CAGGTTTATA TTGTCCGAAA AATATATGCA TTATAAATTT AATTGAATAT 6180 

ACAAATGTGA AGACACTGCC CACTATACCA ATGATTGGGA ATAGGTAGCC TAATGTATCA 624 0 

ACACTGAATA AATTTGCTTG GCTTGCTGTA AATGTTGTTT CTAAAAATGA TTCTTTTGAT 6300 

25 AAGAAACCAT TGAACGGTGG TACACCAGCg CATACTTAAT GCTGTAATAA CAGTGATTGT 6360 

AAATGAAATA GGCATAATTG TTAGTAAGCC ACCTAATTTC TTAACATCAC GTGTACCAGT 642 0 

AGAATGATCC ACTGCACCTG TAATCATAAA TAGGGCACCT TTAAATGTTG CATGGTTGAT 6480 

30 TAAATGGAAT ATTGCAGCCG TAAATGCAGC AGCATATATT TTGCTATCAT CGCCTTGATA 654 0 

GTGATAACTA ATGGCACCGA TTCCAAGCAT CGCCATAATC ATACCTAATT GGGATACTGT 6600 

TGAAAATGCC AGTATACCTT TCAAGTCTTG TTGTTTTGTT GCGTTTAGCG AAgCCCAGAA 6660 

35 

TAATGTAATT AAACCAACGA GTGTGACAGT CCATACCCAA CCTTGCGATG CTGGGAAGAT 6720 

TGGTGTCATT CGAGCGATTA AATATAACCC TGCTTTAACC ATTGTTGCTG AATGAAGATA 678 0 

AGCACTGACT GGTGTAGGTG CTTCCATTGC ATCTGGTAGC CAAATATAAA ATGGAAACTG 684 0 

40 

AGCAGATTTT GTAAAAGCAC CAATCATGAT TAAAATCATC GCAAAAATGA AGAATGGGCT 6900 

ATTTTGAATT TCAGAAGCAT GTTGAATCAT GTACTGAATG CTAAATGATT GTGTTGGTAT 6960 

45 AGCGAGTAAG ATGATACCAC CTAATAATGA TAGACCACCA AATACTGTGA TTATGAGOGA 7020 

TTTTTGAGCA CCATATATAG ATGCTTGTOG TTCGCGCCAG AATGAAATAA GTAAAAAACT 7080 

AGAAAATGAC GTTAGCTCCC AGAATAAATA TAGAATAATA ACATTATCTG AAAGTACGAC 7140 

SO ACCTAACATT GCACCCATAA ATAGTAATAA ATAACAATAA AAATTCCCTA GTTGTTCTGA 7200 

CTTACTTAAG TAGCCGATTG AATATAATAC TACTAAACTG CCGATTCCTG AAATAAGCAA 7260 
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CGAATTTAAG 


GTTTTCATTA 


CAGTATTACC 


TGACATCGTC 


GTTTTAATTA 


ATGTAAGCAT 


7380 






ATtaACUATAG 


GGACAGGTAA 


TACGAACCAT 


CCTAAATGTA 


TACGTTTAAA 


7440 


5 


R 7\ RTPTRTJ1P 

AAA IV I AT. AC 


ACjOATAGGAA 


TAATGAGTGC 


GAATATTAAC 


GGT AAT AT CA 


CCGCAATATG 


7500 




TAACAAACTC 


ACTATGTTGT 


CCTCCTTTAA 


AAAATATTTA 


TGTTATTCAT 


TATACATGAA 


7560 




pwv^ rum nn n nnm 

TGATATAGTT 


ctgaaaaacg 


TACACACTCC 


TTGTTGTGCT 


TTATTTTCAG 


AaGTATTTAA 


7620 


10 


ATAAGAAGAA 


acacgtcatt 


TTTTATTTAA 


AATTTTCTTT 


GTATTGAAGT 


GAATAATCTT 


7680 




CTTTTAAGCG 


TGCTAAACTA 


GCTAAAGACA 


TTTCAGCATG 


TTTTGTTTGC 


TGAGCTTTAA 


7740 


15 


GTTTAGTTTC 


TAAATCTGTA 


ATTGCTTGTT 


GAAGTGAATC 


TTCATAGCGC 


AATACATCAA 


7800 


CATTGAAGTC 


GCGTAATTGT 


GAACGTTTCG 


TATAGCGTTT 


TTCAAAATGG 


CTTAATGCTT 


7860 




TGCGGTCATG 


GAAAAA7ACA 


CCTTCAGTTT 


CAGTAGGGTT 


ATGTAAATCA 


CCTTGTTTCG 


7920 


20 


GGTGTTTGAT 


AACTTGTTCA 


ACTTTAACAA 


GGACATCGTC 


TCCATTTTCT 


TCAACAATCG 


7960 




TGACACCATA 


GCTACCTGTT 


TTGTGTGAAA 


ATCGATATAG 


CTTCATGCTA 


TTTTCCTCCC 


8040 




TTAAAAGTAT 


GTTAATATAT 


ATGTATCATA 


ACATGAATGG 


AGAATATAAA 


TGGCTAACTA 


8100 


25 


TCCACAGTTA 


AACAAAGAAG 


TACAACAAGG 


TGAAATCAAA 


GTGGTTATGC 


ACACAAATAA 


8160 




AGGTGACATG 


ACATTCAAAT 


TATTTCCAAA 


TATTGCACCA 


AAAACAGTTG 


AAAATTTTGT 


8220 




GACACATGCA 


AAAAATGGTT 


ATTATGATGG 


AATCACATTC 


CACCGTGTCA 


TTAATGACTT 


8260 


30 


CATGATTGAA 


GGTGGCGATC 


CAACAGCTAC 


TGGTATGGGT 


GGCGAAAGTA 


TTTATGGCGG 


8340 




TGCTTTTGAA 


GATGAATTTT 


CATTAAATGC 


ATTTAACTTA 


TATGGCG CAT 


TATCAATGGC 


8400 




TAACTGAGGA 


C CT AAT ACT A 


ATGGTTCACA 


ATTTTTCATT 


GTTCAAATGA 


AAGAAGTACC 


8460 


35 


TCAAAATATQ 


TTAAGTCAAC 


TTGCAGATGG 


TGGCTGGCCT 


CAACCAATCG 


TTGATGCATA 


8520 




TGGCSAAAAG 


GGTGGTACAC 


CATGGTTAGA 


TCAAAAACAT 


ACAGTATTCG 


GTCAAATCAT 


8580 


40 


TGATGGTGAA 


a CT ACATT AG 


AAGATATTGC 


AAATACAAAA 


GTGGGACCAC 


AAGATAAACC 


8640 


ACTTCATGAT 


GTTGTAATTG 


AAT CTATTG A 


TGTTGAAGAA 


TAATATCTAA 


ACATAATTAA 


8700 




CTACCAACAT 


TTTAAACTCG 


GATAAAGCTA 


ATTTATGAAT 


GGATTAGTAT 


ATATTCCAAC 


8760 


45 


gAAAATAAAT AAACTAATAT GATGAGCAAT 


CTCAATATAT 


TTATCaAGAA 


AGCACAGTTT 


8820 




TTAAATAGAT 


GTGTATTTTA 


AAGATAATAG 


TTGAGGTTGC 


TTTTTATGTT 


TTTACAGAGA 


8880 




ATTGCTATTC 


AAATAGTAAA 


TAAATTGAAA 


ACAAAGTAGC 


TGGATATCAT 


ATTGATTTAG 


8940 


50 


ATAGGAATTT 


GTTGCTAATT 


TTATTTGTAA 


ATCCAAGTTT 


GTAGAATTCT 


TATTCATTTA 


9000 




TAAAATAATA 


TTCGTATGAT 


ttgatttttt 


AATTAGTCCA 


CCATTTCGAT 


TTGTGCTATG 


9060 
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AACATATCAA 


GGTGCGTGTA 


CTGGTATTCA 


ACCATACGGT 


GCGTTTGTTG 


AGACCCCTAA 


9180 




TCATACTGAA GGACTGATTC ATATATCAGA AATTATGGAT OACTACGTTC ATAATTTQAA 


9240 


5 


GAAATTTCTA 


TCAGAAGGCC 


AAATTGTTAA 


AGCTAAAATT 


TTGTCTATAG 


ATGATGAAGG 


9300 




AAAGCTTAAT 


CTATCATTAA AGGATAATGA 


TTACTTCAAA AATTATGAGC 


GTAAGAAGGA 


9360 




AAAACAATCA 


GTATTAGATG 


AAATCAGAGA 


AACAGAAAAA 


TATGGGTTTC 


AAACACTTAA 


9420 


10 


AGAACGCTTA 


CCAATCTGGA 


TAAAACAGTC 


AAAGCGAGCA ATTCGAAACG 


ACTAAAGGAA 


9480 




CAGATAAATC 


GTACCGAAAA 


TCATACAAAG 


GGTCTGAAAT 


GAAAGTTTCT 


TAGACTATAA 


9540 


15 


AAGAGATTAG 


TATCTATTAA 


ATTTTATTAG 


ATACTAATCT 


CTTTTTGTCT 


ACGATAACGT 


9600 


AATATGaTTG 


ATTCTATTTA 


CACGTACAAA 


TGGTTTAAGG 


TGACATATCC 


ATTATCTTTG 


9660 




TTAGATAGAA 


TCGTTGATTT 


GCaATATTGT 


ATGTGGATTT 


GTTTTTTTTA 


TTTATTTTAG 


9720 


20 


AAATGAGAAC 


TACAACTTAA 


AGTATTAAAC 


GAATTGCAAC 


TATATAAACA 


GATAATTGGA 


9780 




GAATGAAAAA 


ATTACATGTT 


ATAGTCAACT 


CAATAATTTT 


AAGGAGGAAT 


TAAGTAATGA 


9840 




AAAGTAAATA 


OGAACCATTG 


TTTGATAAAG 


TAGAATTACC 


AAATGGAGTA 


GAGTTGAGAA 


9900 


25 


ATCGATTTGT 


GTTAGCCCCT 


TTAACACATA 


TTTCTTCAAA 


TGATGATGGT 


ACTATTTCAG 


9960 




ATGTAGAACT 


TC CTT AT ATT 


GAAAAGCGTT 


CACAAGATGT 


TGGTATTACA 


ATTAATGCTG 


10020 




CGAGTAATGT 


GAGTGATGTC 


GGAAAAGCAT 


TTCCAGGACA 


GCCATCAATC 


GCGCATGACA 


10080 


30 


GTAATATTGA 


AGGACTAAAA 


CGATT AG CT A 


CAGCAATGAA 


GAAAAACGGT GCCAAAGCAC 


10140 




TCGTACAAAT 


ACATCATGGC 


GGTGCACAAG 


CATTGCCTGA 


ATTAACACCT 


GATGGAGACG 


10200 




TCGTAGCACC 


AAGTCCAATT 


TCTTTAAAAA 


(3"i"i"rit3GTCA 


GAAACAAGAA 


CATAGTGCTA 


10260 


35 


GAGAAATGAC 


GAATGAAGAG 


ATTGAACAAG 


CAATCAAGGA 


TTTTGGTGAA 


GCAACGCGAC 


10320 




GTGCAATTGA 


AGCAGGGTTT 


GATGGTGTTG 


AAATACATGG 


CGCGAATCAT 


TACTTAATTC 


10380 


40 


ATCAATTTGT 


ATCACCATAC 


TATAATAGAA 


GAAATGATGT 


ATGGGCAAAT 


CAATATAAAT 


10440 


TCCCGGTCGC 


TGTGATTGAA 


GAAGTACTTA 


AAGCGAAAGA 


AGCGTATGGC 


AATAAAGACT 


10500 




TTATAGTTGG 


ATACAGATTA TCTCCAGAGG 


AAGCGGAGTC 


TCCAGGAATC 


ACAATGGAAA 


10560 


45 


TTACAGAGGA 


ACTCGTTAAT AAAATTAGCC 


ATATGCCAAT 


OGACTATATT 


CATGTTTCAA 


10620 




TGATGGATAC 


GCATGCAACG 


ACACGTGAAG 


GTAAATACGC 


TGGACAAGAA 


AGACTGCCTT 


10680 




TAATTCACAA 


ATGGATAAAT 


GGTCGTATGC 


CACTTATCGG 


TATTGGTTCA 


ATTTTCACAG 


10740 


SO 


CTGACGAAGC 


TTTAGATGCA GTTGAAAATG 


TTGGTGTTGA 


CTTAGTAGCC 


ATTGGTAGAG 


10800 




AGCTACTACT 


GGATTATCAA 


TTTGTTGAAA 


AAATTAAAGA 


TGGACGGGAA 


GATGAAATTA 


10860 
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10 



15 



30 



35 



40 



AATTTAATGA AGQGTTTTAT CCATTACCAC GTA 10953 
(2) INFORMATION FOR SEQ ID NO: 63: 

it) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 8155 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 63: 

TTTGATAnAA AACTGAATnA ATTAAATGTA TCGATTCAAC CTAATGAAGT GAATTTACAA 60 

GTTAAAGTAG AGCCTTTTAG CAnAAAGGTT AAAGTAAATG TTAAACAGAA AGGTAGTTTA 120 

GCAGATGATA AAGAGTTAAG TTCGATTGAT TTAGAAGATA AAGAAATTGA AATCTTCGGT 180 

20 AGTCGAGATG ACTTACAAAA TATAAGCGAA GTTGATGCAG AAGTAGATTT AGATGGTATT 240 

TCAGAATCAA CTGAAAAGAC TGTAAAAATC AATTTwCCAG AACATGTCAC TAAAGCACAA 300 

CCAAGTGAAA CGmAGGCTTA TATAAATGTA AAATAAATAG CTAAATTAAA GGAGAGTAAA 360 

25 CAATGGGAAA ATATTTTGGT ACAGACGGAg TAAGAGGTGT CGCAAACCAA GAACTAACAC 420 

CTGAATTGGC ATTTAAATTA GGAAGATACG GTGGCTATGT TCTAGCaCAT AATAAAGGTG 480 

AAAAACACCC ACGTGTACTT GTAGGTCGCG ATACTAGAGT TTCAGGTGAA ATGTTAGAAT 540 

CAGCATTAAT AGCTGGTTTG ATTTCAATTG GTG CAGAAGT GATGCGATTA GGTATTATTT 600 

CAACACCAGG TGTTGCATAT TTAACACGCG ATATGGGTGC AGAGTTAGGT GTAATGATTT 660 

CAGCCTCTCA TAATC CAGTT GCAGATAATG G T ATT AAATT CTTTGGATCA GATGGTTTTA 720 

AACTATCAGA TGAACAAGAA AATGAAATTG AAGCATTATT GGATCAAGAA AACCCAGAAT 780 

TACCAAGACC AGTTGGCAAT GATATTGTAC ATT ATT CAGA TTACTTTGAA GGGGCACAAA 84 0 

AATATTTGAG CTATTTAAAA TCAACAGTAG ATGTTAACTT TGAAGGTTTG AAAATTGCTT 900 

TAGATGGTGC AAATGGTTCA ACATCATCAC TAG CG CCATT CTTATTTGGT GACTTAGAAG 960 

CAGATACTGA AACAATTGGA TGTAGTCCTG ATGGATATAA TATCAATGAG AAATGTGGCT 1020 

45 CTACACATCC TGAAAAATTA GCTGAAAAAG TAGTTGAAAC TGAAAGTGAT TTTGGGTTAG 1080 

CATTTGACGG CGATGGAGAC AGAATCATAG CAGTAGATGA GAATGGTCAA ATCGTTGACG 1140 

GTG AC CAAAT TATGTTTATT ATTGGTCAAG AAATGCATAA AAATCAAGAA TTGAATAATG 1200 

SO ACATGATTGT TTCTACTGTT ATGAGTAATT TAGGTTT TT A CAAAGCGCTT GAACAAGAAG 1260 

GAATTAAATC TAATAAAACT AAAGTTGGCG ACAGATATGT AGTAGAAGAA ATGCGTCGCG 1320 
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CTGGTGATGG 


TTTATTAACT 


GGTATTCAAT TAGCTTCTGT AATAAAAATO 


AC?TGGTAAAT 


i a. a n 




CACTAAGTGA 


ATTAGCTGGA 


CAAATGAAAA AATATCCACA ATCATTAATT 




X DUU 


5 


TAACAGATAA 


ATATCGTGTT 


GAAGAAAATG TTGACGTTAA AGAAQTTATG 


ACTAAAGTAG 


1 CCD 




AAGTAGAAAT 


GAATGGAGAA 


GGTCGAATTT TAGTAAGACC TTCTGGAACA 


aACCATTAGT 




10 


TOGTGTCATG 


GTTGAAGCAG 


CAACTGATGA AGATGCTGAA aGATTTGCAC 


AACAAATAGC 


icon 


TGtATGTXWrT 


CAAGATAAAA 


TGGGATTAGA TAAATAAATA CTGTATTACA 


AATGAGCCGA 


1740 




TGCGTATGcA 


nTcgtTTTTT GTGTTTGTAG AAATAATTTA TAGTACAAAC GTAAAATGAT 


1800 


15 


ATAAACAAAA 


IaAAAALAAA 


GTAATCAATA TGTAATATAA AATACACTGG 


TACTCAATAT 


I860 




ATA ATT2 ATY3 A 


x AAAA1TAAT 


TTTAATTAGA TAGAGTTGCT TTGTGTTTTT 


AACGCAGATG 


1920 




V» InL X aw X Ui 


TCTTAACAGT 


TGATTAAGTG AAATCATTTA ACAGCGAGAA 


TAATCAACCA 


1980 


20 




TTAATGAATT 


TATTCAGACA ACAAAAATTT AGTATCAGAA AATTTAATGT 


2040 




CGGTATTTTT 


TCAGCTTTAA 


TTGCCACTGT TACTTTTATA TCTACTAACC 


CGACAACAGC 


2100 




lix LTlviCAJGCA 


GAGCAAAATC 


AGCCTGCACA AAATCAACCA GCACAACCAG 


CTGATGCCAA 


2160 


25 


TAGACAGCCT 


AACGCAAATG 


CTGGTGCTCA AGCTAAT CCT ACAGCACAGC 


CAGCTGCACC 


2220 




TGCCAACCAA 


GGACAACCAG 


CAGTACAACC AGCAAACCAA GGTGGACAGG 


CTAATCCAGC 


2280 




AGGAGGAGCA 


GCACAACCAA 


ATACACAACC AGCTGGACAA GGTGATCAAG 


CTGATCCGAA 


2340 


30 


TAACGCTGCA 


CAAGCACAAC 


CTGGAAATCA AGCAACACCG GCAAACCAAG CAGGTCAAGG 


2400 




AAATAACCAA 


GCAACACCTA 


ATAATAATGC AACACCGGCA AATCAAACAC 


AGCCAGCGAA 


2460 


35 


TGCTCCAGCA 


GCAGCGCAAC 


CAGCAGCACC TGTAGCAGCA ' AACGCACAAA. CTCAAGATCC 


2520 


AAATGCTAGC 


AATACTGGTG 


AAGGCAGTAT TAATACGACA TTAACATTTG - ATGATCCTGC 


2580 




CATATCAACA GATGAGAATA GACAGGATCC AACTGTAACT GTTACAGATA AAGTAAATGG 


264 0 


40 


TTATTCATTA 


ATTAACAACG 


GTAAGATTGG TTTCGTTAAC TCAGAATTAA 


GACGAAGCGA 


2700 


TATGTTTGAT 


AAGAATAACC 


CTCAAAACTA TCAAGCTAAA GGAAACGTGG 


CTGCATTAGG 


2760 




TCGTGTGAAT 


GCAAATGATT 


CTACAGATCA TGGTAACTTT AACGGTATTT 


CAAAAACTGT 


2820 


45 


AAATGTAAAA 


CCAGATTCAG 


AATTAATTAT TAACTTTACT ACTATGCAAA 


CGAATAGTAA 


2880 




GCAAGGTGCA 


ACAAATTTAG 


TTATTAAAGA TGCTAAGAAA AATACTGAAT 


TAGCAACTGT 


2940 




AAATGTTGCT 


AAGACTGGTA 


CTGCACATTT ATTTAAAGTA CCAACTGATG 


CTGATCGTTT 


3000 


SO 


AGATTTACAA 


TTTATTCCTG 


ACAATACAGC AGTTGCTGAT GCTTCAAGAA 


TTACAACAAA 


3060 




TAAAGATGGT 


TATAAATACT 


ATTCATTCAT TGATAATGTA GGTCTATTCT 


CAGGATCACA 


3120 



65 



483 



EP0 786 519 A2 

TAATACTGAA ATCGGTAACA ATGGTAATTT TGGTOCTTCA TTAAAAOCAG ATCAATTTAA 3240 

ATATGAAGTA ACATTACCAC AAGGTGTAAC TTACGTTAAT AATTCATTAA CTACAACATT 33 00 

5 CCCTAATGGT AATGAAGACA GTACAGTATT GAAAAATATG ACTGTTAATT ATGATCAAAA .3360 

TGCAAATAAA GTTACATTTA CAAGCCAAGG TGTGACAACG GCACGTGGTA CACACACTAA 3420 

AGAAGTTTTA TTCCCAGATA AATCTTTAAA ATTATCATAT AAAGTTAATG TTGCGAATAT 3480 

10 CGATACACCT AAAAATATTG ATTTTAATGA AAAATTAACA TATCGTACTG CTTCAGATGT 354 0 

TGTAATTAAT AATGCGCAAC CAGAAGTaCA CTAACTGCAG ATCCATTTTC AGTAGCGGTT 3600 

GAAATGAACA AAGATGCGTT GCAACAACAA GTAAACTCAC AAGTTGATAA TAGTCATTAC 3660 

15 

ACAACAGCAT CAATTGCAGA ATACAATAAA CTTAAACAAC AAGCAGATAC TATTTTAAAT 3720 

GAAGATGCGA ATCATGTTAA AACTGCAAAT CGTGCATCTC AAGCGGATAT TGATGGTTTA 3780 

GTAACTAAAT TACAAGCTGC ATTAATTGAT AATCAAGCAG CAATTGCTGA ATTAGATACT 384 0 

20 

AAAGCTCAAG AAAAGGTTAC AGCAGCACAA CAAAGTAAAA AAGTTACGCA AGATGAAGTT 3900 

GCAGCACTTG TAACTAAAAT TAACAATGAT AAAAATAATG CAATCGCAGA AATTAATAAA 3960 

2S CAAACTACAG CACAAGGTGT CACAACTGAA AAAGATAATG GTATCGCAGT GTTAGAACAA 4020 

GATGTGATTA CACCAACAGT TAAACCTCAA GCGAAACAAG ATATTATCCA AGCAGTTACA 4080 

ACTCGTAAAC AACAAATTAA AAAGTCAAAT GCATCATTAC AAGATGAAAA AGATGTAGCA 4140 

30 AATGATAAAA TTGGTAAAAT TGAAACAAAG GCAATTAAAG ATATTGATGC AGCAACAACA 4 200 

AATGCACAAG TAGAAGCCAT TAAAACAAAA GCAATCAATG ATATTAATCA AACTACACCT 4260 

GCTACAACAG CTAAAGCAGC AGCTCTTGAA GAATTTGACG AAGTTGTTCA AGCACAAATT 432 0 

35 GATCAAGCAC CTTTAAATCC TGATACAACA AATGAAGAAG TAGCGGAAgC TATTGAACGT 4 380 

ATTAATGCAG CTAAAGTTTC TGGTGTTAAA GCAATTGAAG CGACAACGAC TGCACAAGAT 4440 

TTAGAAAGAG TTAAAAACGA AGAAATCTCA AAAATTGAAA ATATTACTGA CTCTACGCAA 4 500 

40 

ACAAAAATGG ATGCCTATAA T G AAGTT AAA CAAGCTGCAA CAG CT AG AAA AGCTCAAAAT 4 560 

GCTACAGTTT CAAATGCAAC AAATGAAGAA GTAGCAGAAG CTGATG CAG C AGTAGATGCA 4 620 

GCTCAAAAGC AAGGTTTACA TGACATCCAA GTTGTTAAAT CAAAACAGGA AGTTGCTGAT 4 680 

45 

ACAAAATCAA AAGTATTAGA TAAAATGAAT GCAATTCAAA CACAAGCAAA AGTTAAACCT 474 0 

GCAGCTGATA CGGAAGTAGA AAACGCATAT AATACACGTA AACAAGAAAT TCAAAATAGC 4 8 00 

SO AATGCTTCAA CTACAGAAGA AAAACAAGCT GCATATACAG AATTAGATAC TAAAAAGCAA 4 86 0 

GAAGCAAGAA CAAATCTTGA TGCTGCAAAT ACAAACAGTG ATGTAACAAC AGCTAAAGAC 4920 
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10 



15 



so 



25 



35 



40 



45 



GCGGAAATCG 


CTCAAAAAGC 


AAGTGAACGT 


AAAACAGCAA 


TTGAAGCAAT 


GAATGATTCG 


5040 


ACTACTGAAG 


AACAACAAGC 


AGCGAAAGAC 


AAAGTGGATC 


AAGCAGTAGT 


TACTGCAAAC 


5100 


GCTGATATAG 


ATAATGCTGC 


AGCAAACAAT 


GATGTGGATA 


ATGCAAAAAC 


TACAAATGAA 


5160 


GCTACAATCG 


CAGCCATTAC 


ACCTGATGCA AATGTTAAAC 


CAGCAGCAAA 


ACAAGCAATT 


5220 


GCAGATAAAG 


TACAAGCTCA 


AGAAACAGCA 


ATTGATGGAA 


ATAACGGCTC 


AACAACTGAA 


5280 


GAAAAAGCAG 


CTGCTAAACA ACAAGTTCAA ACTGAAAAAA 


CAACAGCTGA 


TGCCGCAATA 


5340 


GATGCAGCAC 


ATACAAATGC 


GGAAGTTGAA 


GOGGCTAAAA 


AAGCAGCAAT 


TRTTAAAATT 


5400 


GAAGCGATTC 


AGCCAGCAAC 


AACAACTAAA 


GATAATGCGA 


AAGAAGCAAT 


TGCTACGAAA 


54 fin 


GCGAATGAAC 


GTAAAACAGC 


AATCGCTCAA 


ACGCAAGACA 


TTACTGCTGA 


AGAAATTG PA 


cc^n 


GCGGCTAATG 


CGGACGTAGA 


TAATGCTGTG 


ACACAAGCAA ATAGCAACAT 


'It R/^f IV.1/ ** 1* 
X vxnnwKa X VJv. X 




AATAGTCAAA 


ATGATGTAGA 


CCAAGCGAAA 




AAAATAGTAT 




Do4U 


ACAC CAACAG 


TTAATAAAAA 

A A.*»»A A <*»*»«A*W» 




fYTTA ATY7AAA 


TCACAGCAAT 


X X 1AAAXAAL 


5700 


AAATTGCAAG 


AGATTCAAG c 




Gf^AAOAGATG 


AAGAAAAACA 




5760 


GCTTGAAGCAA 


ATACTGAAAA 


TGGTAAAGCA 


AATCAAGCCA 


TTTCAGCAG C 




5820 


GCACLAAGTTG 


ATGAAGCTAA 


AGCAAATGCA 


GAAGCAGCGA 


TTAATGCGGT 




5880 


GTTGTGAAGA 

w X X w Iw/VVJA 


AACAAGCGGC 


TAAAGATGAA 


ATTGATCAAT 


TACAAGCAAC 


GCAAACAAAT 


5940 


GTTATC^AATA 


ATGATCAGAA 


CGCTACAACA 


GAAGAAAAAG 


AAGCAGCTAT 


TCAACAATTA 


6000 




TTACAGACGC 


GAAAAATAAT 


ATTACAGCTG 


CAACTGATGA 


TAATGGTGTA 


oUbU 


G ATCAGG CG A 


AAGACGCTGG 


AAAGAATTCA 


ATTCAAAGCA 


CGCAACCAGC 


AACAGCGGTT 




AAATCAAATG 


CTAAAAATGA 


TGTTGATCAA 


GCTGTGACAA 


CTCAAAATCA- ; AGCAATTGAT 


' D X. O U 


AATAGAACTG 


GTGCTACAAC 


TGAAGAGAAA 


AATGCAGGAA 


AAGATTTAGT 


TTTAAAAGCT 


O *» V 


AAAGAAAAAG 


CGTATCAAGA 


TATCTTAAAT 


GCACAAACAA 


CTAATGATGT 


TACGCAAATT 


6300 


AAAGATCAAG 


CAGTTGCTGA 


TATTCAAGGT 


ATTACTGCAG 


ATACAACAAT 


TAAAGATGTT 


636 0 


GCGAAAGATG 


AATTAGCAAC 


AAAAGCAAAC 


GAACAAAAAG 


CGCTTATTGC 


ACAAACTGCA 


6420 


GATGCGACTA 


CTGAAGAAAA 


AGAACAAGCA 


AATCAACAAG 


TAGACGCACA 


ATTAACACAA 


€480 


GGTAATCAAA 


ATATTGAAAA 


TGCACAGTCA 


ATCGATGATG 


TAAACACTGC 


AAAAGATAAT 


6540 


GCAATTCAAG 


CAATTGACCC 


AATTCAAGCA 


TCAACAGATG 


TTAAAACGAA 


TGCAAGAGCG 


6600 


GAATTGCTAA 


CTGAAATGCA 


AAATAAAATA 


ACTGAAATAC 


TTAATAATAA 


TGAGACTACT 


6660 


AATGAAGAAA 


AAGGTAACGA 


TATTGGACCA 


GTTAGAGCAG 


CATATGAAGA 


AGGTTTAAAT 


6720 
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AAAGTTCAAC AACTTCATGC AAATCCTQTT AAGAAACCAG CAGGTAAAAA AGAATTAGAT 684 0 

CAAGCTGCAG CTGATAAGAA AACACAAATA GAACAAACAC CAAATGCATC ACAACAAGAA 6900 

5 ATTAATGATG CAAAACAAGA AGTTGATACT GAATTAAATC AAG CGAAAAC AAATGTCGAT 6960 

CAATCATCAA CAAATGAATA TGTTGATAAT GCAGTTAAAG AAGGAAAAGC TAAAATTAAT 7020 

GCAGTTAAAA CATTTAGTGA GTACAAAAAA GATGCTTTAG CTAAAATTGA AGATGCATAT 7080 

10 AATGCTAAAG TAAACGAAGC GGATAACTCT AACGCATCGA CTTCAAGTGA AATTGCTGAA 714 0 

GCGAAACAAA AACTTGCTGA ATTAAAACAA ACTGCGGATC AAAATGTTAA TCAAGCTACT 7200 

TCTAAAGATG ACATTGAAGT TCAAATTCAT AATGACTTAG ATAATATTAA CGATTACACA 7260 

15 

ATTCCAACAG GTAAAAAAGA ATCAGCTACA ACAGATTTAT ATGCTTATGC AGATCAGAAG 7320 

AAAAATAATA TTTCAGCTGA CACTAATGCA ACACAAGATG AAAAGCAACA AGCAATTAAG 7380 

CAAGTTGACC AAAATGTTCA AACTGCATTA GAAAGCATTA ATAATGGTGT GGATAATGGT 7440 

£0 

GACGTTGATG ATGCATTAAC ACAAGGTAAA GCAGCAATTG ATGCTATTCA AGTAGATGCT 7500 

ACTGTTAAAC CTAAAGCGAA CCAAGCTATT GAAGTTAAAG CAGAAGATAC GAAAGAATCT 7560 

26 ATTGATCAAA GTGACCAGTT AACTGCTGAA GAAAAAACTG AAGCATTAGC AATGATTAAA 7620 

CAAATTACAG ATCAAGCTAA ACAAGGTATT ACTGATGCAA CAACAACTGC TGAAGTTGAA 7680 

AAAGCGAAAg cTCaAGGACT TGAAGCATTT GATAACATTC AAATCGACTC AACAGAAAAA 774 0 

30 CAAAAAGCTA TCGAAGAATT AGAAACTGCA CTAGACCAGA TTGAAGCAGG TGTAAATGTC 7 800 

AACGCTGATG CTACAACTGA AGAAAAAGAA GCGTTTACGA ATGCTTTAGA AGACATTTTA 7860 

TCAAAAGCAA CTGaAGATAT TTCTGATCAA ACTACAAATG CAGAAATCGC TACTGTCAAA 7 92 0 

35 AATAGTGCGC TTGAACAACT TAAAGCACAA CGTATTAATC CTGAAGTTAA GAAAAATGCT 798 0 

TTGGAAGCAA TCAGAGAAGT GGTTAACAAG CAAATAGGAA tAATTAAAAA TGCAGATGCA B04 0 

GATGCATCGG CGGAAAGAnA TTGCACGTAC GGGATTTAGG TAGATATTTT GGACCGATTT 6100 

40 

GCTGGATAAA TTTAGGGTnA AACCCCAACC AATGCCGAAG TTGCCTGAAT TACCA 815 5 

(2) INFORMATION FOR SEQ ID NO: 64: 

(i) SEQUENCE CHARACTERISTICS: 
45 (A) LENGTH: 1630 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 

SO 

<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 64: 
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CTGTTTTATT TGCAGCACCC ATACTGGAAA TCACTTTAAT CCCTCGGTCA AGACACTCTT 120 

TCATTAAGTG TACTTTGTAC ATTATTGTAT CACTTGCATC TACAAAATAA TCTATATCGT 180 

AGTTATCGAA AATTTCTTCA TATGTCTCTT CTOTATAAAA CATATGTAAO GGCGTQACTT 24 0 

TACAATCTGG ATTAATTAAT TTAATACGTT CTTCCATCAA AGAAACTTTA CTTTGTCCTA 300 

CCGTTGTAGT TAAAGCGTGT AATTGTCTGT TTACATTTGT AATATCAACA TCATCTTTAT 360 

CTATTAATAT AATATGACCA ATATTCGTTC TTGCTAATGC TTCAGCAGCA AATGAACCAA 420 

CACCTCCAAC GCCAAGTATG ACAACAGTTT GTTGCTTCAA TAAATCTAAA CCTTGTTGTC 480 

CAATCGCTAG TTCATTTCTT GAAAATTGAT GTTTCATTAT TTTACCTCTT TCACTGATTT 54 0 

ATACATAAGT ACATAGTAAC TTAAAATTTT ATATTTAGCA TTATCACTTT GATTATTTTC 600 

CCAAAATTCA ACGAGGAAAC ATTTATTAAA CGCTATAAAA CCCAACTAAT TCTTTATTAA 660 

AAACTTAAAG AAACG CATAA AAATACGCAA GACAAAGTCT TGCGTATCGA TAGAGTCCGT 720 

ATTGCCGTAG TTATAATAGC TTGATCATTC GGCCTGTTAT ATACAGGTGG GTGCCCTGTT 780 

TCTTGTTTTG TACGTCCTTC ATATAAGGCG TGTACGCTGC AAGAAAACCC ATTGGGCTCC 840 

2s CTTGATCAAA GAGTGTTAGG CCCAAATTAA AAAGCAAACT TACGAACAAC TCAGATGACT 900 

ATCTTATGAT GTTATATTAC CACATAATTA AAATTAATGA AATTATAACA AACCAAAGTT 960 

TATTGATTTT TTAAAATTTA GTGACGAATT CGCAAAGAAA GTTCTTCTAA TTGTTTATCA 1020 

30 GAAACTTCAC TAGGCGCATT CGTTAATAAA CATGTAGCAG ATGCTGTTTT AGGGAATGCG 1080 

ATTGTATCTC TCAAGTTTGT TCTATTAGTC AATAACATGA CTAATCGGTC tAATCCTAAT 1140 

GCAATACCGC CATGTGGTGG TGCACCATAT TTAAATGCAT CTAGTaAGAA GCCGAACTGT 1200 

TCCTgTGCTT GTTCTTTAGT AAATCCAAGA ACTTCGAACA TTTTTTCTTG TAACTCACCA 1260 

TCATGAATTC TGATTGAACC GCCACCTAAT TCATAACCAT TTAATACTAT GTCATAAGCA 1320 

TTTGCCTCAG CTTCtTCTGG CGCAGTGCCA AGCTTAGCAA TATCAGCTTC TTTTGGAGAT 1380 

GTAAATGGAT GATGTGCTGC AACGTAACGT TTCGCATCTT CATCATATTC TAATAATGGC 144 0 

CAATCTGTCA CCCATAAGAA GTTTAATTTT GTTTCATCGA TTAAACCTAA TTCTTTAG CT 1500 

AATTTGACAC GTAATGCACC TAAACTTTGT GCAACGACAT TTGGTttGTC TGCAACAAAC 1560 

ATTACTAAGT CACCAGCTTC AGCACCAGTT AATGTAAGTA ATGTTTCAAC ATTTTCTGTT 1620 

CAAAGAAACG 1630 

So <2) INFORMATION FOR SEQ ID NO: 65: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 732 base pairs 
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(C) STRANDEDNESS : double 

(D) TOPOLOGY : linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 65: 

CAATTGGACA TCTTGTATGA AAAGGACAAC CTTGCGGCGG ATTACTTOGC OAAGGTAATT 60 

10 CTCCTTTTAA TATAATTCTA TTGTTATTAT GTTTATCAAT TTGTGGTATT GATGAAATCA 120 

ACGCTTTTGT ATATGGATGT TTGGGATTTT CATAAATTTC TTTATCAGAT GCGATTTCAA 18 0 

CTATATGACC TAAATACATA ACTCCAATGA CATCACTTAT ATGTTTTACT ACACTTAAAT 240 

15 CATGTGCGAT AAATAAATAG CTTAAGTTAA ATTGTTCTTG TAAATCTTTT AATAAATTCA 300 

GTACTTGAGA TTGAACAGAT ACATCTAATG CACTTACAGG CTCATCAGCA ACAATTAAAC 360 

TCGGACGCAA AGCCAATGCT CTTGCAATTC CCACTCTTTG TCTCTGTCCA CCTGAAAATT 420 

CATGTGCATA TTtATAATAT GCATCTTCAC TTAGGCCAAC ACATTTTAAT AAATATAGTA 4 80 

CTTCTTTTTT TATTTCTTCT TTTGGCAATT TTTTATAATT TAAAATAGGT TCTGAAATGA 54 0 

TATCTCCAAC CATTTGCATC GGATTCAATG ATGCATACGG ATCTTGAAAT ATCAT CTGAT 600 

ATTGTTGTCG TGATTTTCTG AGTTTTTTAC CTTGTAATCT TGTTATATCT TCACCATTAA 660 

. CAATTATTGA GCCTGAAGTT GCATCTTCAA GCCTGATAAT CACTTTACCT AACGTTGACT 720 

TACCACAACC CG 732 
(2) INFORMATION FOR SEQ ID NO: 66: 



20 



25 



30 



..-(i) SEQUENCE CHARACTERISTICS: 

<A) LENGTH: 583 8 base pairs 
35 (B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 66: 

AATATATTCA TATGTTTCAT CAACAATATT AGCTGCTTTT TGAATTAAAG CAATTTCGTC 60 

AGCATCTTTG ACGTCTCTAA TTTTATCTAC AGTATTAGAA ATGCTTATTA ATGATATACG 12 0 

GCTTTTATTT AATTCAAGGT ATGTATCATA ACTTACATGA TGCCCCTCAA AACCTACATT 180 

TTCAAAATTT TCTTGGTGTA GCAATTCTTT AATCTCACCA ATAATAGTAG ATTTACGATT 240 

AATAATTTCA TAATTTGGCG CCTGCTTAGT TGCTTGATCA ATATATCTAA AGTCTGTTAT 300 

CAAATATTGT TTATCTTTAG ATATGATAAG TGCTCCACTG GTACCAGTAA AACCTGATAA 360 

ATATCTTCTA TTGTAATCCG AAAGAATGaT AATCGCATCT AAATGTTTTT GTTCTAAAAT 42 0 
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CAACTTTATA 


. GATTAAAATA 


> ATATCATAAT AAGGATAAAA 


AATAATAGAT 


ATTGATTTTA 


S40 




GGGAGATAGT 


AATGAAAAAA 


► TTGGTTTCAA 


TTGTTGGCGC 


AACATTATTG 


TTAGCTGGAT 


600 


s 


GTGGATCACA 


AAATTTAGCA 


CCATTAGAAG 


AnAAAACAAC 


AGATTTAAGA 


GAAGATAATC 


660 




ATCAACTCAA 


ACTAGATATT 


CAAGAACTTA 


ATCAACAAAT 


TAGTGATTCT 


AAATCTAAAA 


720 


10 


TTAAAGGGCT 


TGAAAAGGAT 


AAAGAAAACA 


GTAAAAAAAC 


TGCATCTAAT 


AATACGAAAA 


780 


TTAAATTQAT 


GAATGTTACA 


TCAACATACT 


ACGACAAAGT 


TGCTAAAGCT 


TTGAAATCCT 


840 




ATAACGATAT 


TGAGAAAGAT 


GTAAGTAAAA 


ACAAAGGCGA 


TAAGAATGTT 


CAATCGAAAT 


900 


15 


TAAATCAAAT 


TTCTAATGAT 


ATTCAAAGTG 


CTCACACTTC 


ATACAAAGAT 


GCTATCGATG 


960 




GTTTATCACT 


TAGTGATGAT 


GATAAAAAAA 


CGTCTAAAAA 


TATCGATAAA 


TTAAACTCTG 


1020 




ATTTGAATCA 


TGCATTTGAT 


GATATTAAAA 


ATGGCTATCA 


AAATAAAGAT 


AAAAAACAAC 


1080 


20 


TTACAAAAGG 


ACAACAAGCG 


TTGTCAAAAT 


TAAACTTAAA 


TGCAAAATCA 


TGATAGGAGT 


1140 




CTTTTAATGC 


GTAATATAAT 


ATTTTATCTT 


GTACTTATTA 


TTGCTGCX3AT 


TGGATTAGTA 


1200 




ATGAATCTAG 


ATGCCTTTAT 


TTTTTCAATC 


GTCAGAATGT 


TAATCAGCTT TGcgTAaTAG 


1260 


25 


CTGGTATTAT 


TTATCTGATT 


TATTATTTCT 


TCATCTTAAC 


TGAAGACCAA 


CG CAAAT AT C 


1320 




GCAAAGCAAT 


GCgTrAaGTA 


TAAAAGAAAT 


CAAAGAAGAA 


AATAGATAAA 


AAAACGGAAG 


1360 




CACTTGTAGG 


TAAAATAGTC 


TACGTGCTTC 


cattttttat 


TCTAAAAACT 


ACTTTCTAAA 


1440 


30 


CATCCATTCA 


TCTGAACGAT 


ATTTTTCAGT 


TAATTCTTCC 


ACTTCTGCCA ATTGAGCTTC 


1500 




TGtTAATTCA 


AGTGGCTTTA 


ATTCTATATT 


TAAACCTTTC 


TTAAAACCTT 


TCTCGAAAGC 


1560 


35 


TTCTTCCATT 


TGACTAATAG 


TAATGTGTTC 


ATCTGAAATA 


TCATTGATGG 


CAACTGCTTT 


1620 


TTCAACGAAT 


GCCTCTTTCA 


TTTTTAATTT 


TAATCTTTCA 


TTTTTATAAA TrAACATATC 


1680 




AAACAGTTCA 


TCAATATCAA 


TATCTTGTAA 


AATCGAACCG 


TGTTGGAGGA 


TTACGCCCTT 


1740 


40 


TTGTCTCGTT 


TGAGCACTCC 


CAGCAATCTT 


ACGGCCTTCA 


ACAACTAGCT 


CATACCAACT 


1800 




TGGTGCATCA 


AAACACACTG 


AACTTCGAGG 


TTGTTTTAAT 


TTTTGACGCT 


CTTCAGGCGT 


1860 




TTTAGGTACC 


GCAAAATAAG 


TATCAAATCC 


TAAGTTTTTA 


AATCCTTCTA 


ATAATCCTTG 


1920 


45 


TGAAATCACT 


CTGTACGCTT 


CTGTAACTGT 


AGAAGGCATA 


TTCGGATGCG 


ATTCAGGCAC 


1980 




AATCACACTG 


TAAGTTAACT 


CTTTATCATG 


TAGCACCCCA 


CGGCCACCAG 


TTTGACGCCT 


2040 




TACGAGACCA 


AAACCTTTCT 


CTTTAACCTT 


ATCAATATCA 


ATTTCTTTTT 


GTAGCCTTTG 


2100 


50 


GAAATACCCT 


ATTGATAATG 


TTGCAGGATT 


CCATGTGTAA 


AAACGTATAA 


CTGGATCAAT 


2160 




TTCACCTCTA 


GAGACAAAAT 


TTAATAACGC 


TTCATCCATT 


GCCATATTAT 


AATATGGGTC 


2220 
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10 



15 



25 



AAATGTATAA TATTTGATTC GCTAATTAAT CAATTTAACT AAATGAATAA TAATTGCAAT 2340 

TCTTTAGTGA AATATTTTGA TAATTTGACC TAACAGTCTT ATAATTATAT TATCGTTTAA 2400 

TTAGGGAGGA TGCAAGATGA GTGCTAGTTT GTACATCGCA ATAATTTTAG TTATAGCAAT 2460 

TATTGCTTAT ATGATTGTTC AACAAATTCT TAACAAGCGA GCTGTTAAAG AATTAGATCA 2520 

AAATGAATTC CATAATGGGA TTAGAAAAGC TCAAGTCATC GATGTTAGAG AGAAAGTTGA 2580 

CTATGACTAC GGTCACATTA ATGGGTCTCG CAATATTCCT ATGACAATGT TCAGGCAACG 264 0 

ATTCCAAGGA TTAAGAAAAG ATCAACCGGT ATACTTATGT GATGCCAATG GGATTGCTAG 2700 

CTATAGAGCC GCTCGTATTT TGAAAAAGAA TGGATATACA GATATCTATA TGTTAAAAGG 2760 

CGGCTATAAA AAATGGACTG GAAAAATAAA GTCTAAAAAA TAGTTTTTGT AAATTTAATA 2820 

TACGATTTAA TAAAATCTGA GTGTTAATTG ATCATCAATA ACAATACTCA GATTTTAATT 2880 

20 TTTTAACAAA GTCTGTTACT ATATTTCTCT AGCTTCACTG ATCATTAAAC TTAGTTTCAG 2940 

CATAATAAAG AAAGTTCAGC TCATTTTCAA TACGATTCAA TTACCGCAAT CTAAAAAATG 3000 

AAAAGACAAT TTCTATGAAA GAATAATAGC AAACCCTAAG AOTTATTACT TCGGTTTAGT 3060 

TTTCTTGTTT AAATAGAAAT TGTCTTTTTC AATTGATTTT GAAACCATTA TCCTTAAATC 3120 

TTCATACAAA GTTAGAATAA TAATTCTCGG AATATGTGTT TAATACTTTA TTTTTCCTGT 3180 

TTAAGATTTT CAAACTTTAA TATTGGTTTA . CGAGCAGCTG TAGCTTCGTC TAATCGATCA 3240 

ATCACAGTTG TATGTGGTGC TTCTAGCacT TTATCAGGAT CATTTTTAGC TTCTTCAGCA 33 00 

ATACTAATTA ATGTATCGAT AAAATAATCA AGTGTTTCTT TAGACTCTGT CTCAGTCGGT 3 3 60 

TCAATCATCA TACCTTCTTC AACATTTAAT GGGAAGTATA TTGTTGGTGG ATGTACACCG 3 420 

AAATCTAATA ATCGCTTAGC CATGTCTAAA GTACGTACAC CAAATTCTTT TTGACGCACA 34 80 

CCACTTAACA CAAACTCGTG TTTACAATAT TGTTTATAAG GTATTTCAAA GTGTTTAGAT 3 54 0 

40 AAACGTGCTT TAATATAATT CGCATTAAGA ACCGCTGCTT CAGAAACCTC TTTAAGTCCA 3600 

GTTGCTCCCA TAGTTCGAAT ATACGTATAA GCTCTTAAGT AAATACCAAA GTTACCATAA 3 660 

AATGGTTTTA CACGTCCGAT AGAATTTTTA ATGT CATTAT CATATTTAAA TTTGTCGCCA 3720 

45 TCTTTAATAA CCATTGGCTT TGGTAAGTAA CTTGCTAGTT CTTTTACTAC ACCGACTGGA 3780 

CCTGAACCAG GACCGCCACC ACCATGTGGA CCAGTAAATG TTTTATGCAA GTTTAAATGA 3 840 

ACAGCATCAA ATCCCATATC TCCTGGG CGA ACTTTGTCCA TAATAGCGTT TAAATTCGCA 3 900 

60 

CCATCATAAT ATAATAGACC ACCAGCATTA TGGACGATTT CACGGATTTC CATAATATTT 3 960 

TTTTCGAAAA TACCTAAAGT GTTTGGATTA GTTAACATAA TAGCTGCTGT ATTTTCATTT 4 020 
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GATTTAAATC 


CTGCAAATGa 


AGCTGAGGCT 


GGaTTCGTAC 


CATGCGCAGA 


ATCTGGCACA 


4140 




ATGACTTCAT 


CACGATGACC 


TTCACCATTA 


TTCTCATGGT 


AAGCTTTAAA 


TATCATCAAT 


4200 


5 


GCAGTCCATT 


CACCATGTGC 


GCCAGCAGCT 


GGTTGTAATG 


TCACCTCATC 


CATACCAGTA 


4260 




ATTTCTTTTA 


ATTCTTCTTG 


CAAACTATAA ATAATTTCTA ATGAACCTTG 


AACTTGATCT 


4320 




TCATCTTGTA 


ATGGATGTGA 


TTCACTAAAT 


CCTGGTATTC 


TAGCAACCTT 


TTCATTAATT 


4380 


10 


TTAGGGTTAT 


ACTTCATCX3T 


ACATGAACCC 


AATGGATAAA 


ATCCGTTGTC 


TACACCGAAA 


4440 




TTTTTATTTG 


AAAGTTCAGT 


ATAATGACGT 


ACTAAGTCTA 


GTTCAGCAAC 


TTCAGGAAAC 


4500 


15 


TCCGCTTTGT 


TTTTACGA^T AAATTTATCA TCTAACAATG ACTCAACAGA ATTTGTTTTA 


4560 


ATATCACTTT 


TTGGTAATGA 


ATATGCATAT 


CTGCCTTCAC 


GAGATCTTTC 


AAAAATTAAT 


4620 




GGACTTGATT 


TACTAGTCAT 


TTAACTCACC 


AGCCTTTTCT 


ACAAATGTAT 


OGATTTCATC 


4680 


20 


TTTTGTTCTT 


AATTCAGTTA 


CAGCTATTAA 


CATGTGATTT 


TTAAAGTCGT 


CTGAAACAAC 


4740 




ACCTAAATCA 


AAACCACCGA 


TAATATTGTA 


CTTCACTAAT 


TCCTCGTTAA 


CTTGTTGAAT 


4800 




TGGTTTGTCA 


AATTTGACTA 


CAAACTCATT 


GmnAAGnTGT 


ACCATCTAAT 


ACTTCAAAAC 


4860 


25 


crrrrrxAAT 


AAATTGTTGT 


TTAGCATAGT 


TAGCATGTTC 


TATATTTTGA 


ACTGCAATAT 


4920 




CATAGATACC 


TTGTTTACCA 


AGTGCTGACA 


TTGCAATTGA 


TGa CGcTAAA 


GCATTTAATG 


4980 




CTTGGTTAGA 


ACAAATATTA 


GATGTCGCTT 


TATCGCGTCG 


AATATGTTGT 


TCACGTGCTT 


5040 


30 


GTAATGTTAA 


TACAAAGCCA 


CGATTACCTT 


CATCATCTTG 


TGTTTGACCG 


ACTAATCTAC 


5100 




CTGGCACTTT 


ACGCATTAAC 


TTTTTCGTCG 


TTGCAAAATA 


TCCACAATGT 


GGCCCACCGA 


5160 


35 


ATTGAGCAGG 


AATTCCGAAT 


GGCTGAGTAT 


CACCTACAAC 


AATATCTGCA 


CCAAATGAAC 


5220 


CTGGAGGTGT 


AAGTAATCCC 


AATGCTAATG 


GATTTGCATA 


TACGATAAAT AATGCTTTTT 


5280 




TATCCTCAAT AAAGCTATGA ATCTTTTCAA GATCTTCAAT 


TGAACCGTAA 


AAGTTTGGAT 


5340 


40 


ATTGTACTGC 


AACAGCTGCT 


GTTTCATCAT 


CCACTGCTGC 


TTCTAATTTT 


TTCAAATCTG 


5400 




TAACAGTGCC 


ATCTAAATCG 


ATTTCCACTA 


CTTCGAATTC 


CTTACGCGTC 


TT AG CAT AAG 


5460 




TATGAAGTAC 


TTGTAATGCT 


TGATAATGTA 


AACCTTTTGA 


GACTACAATT 


TTATTTTTCT 


5520 


45 


WiTlWACT 


AAATGCTAAG 


ATACATGCTT 


CAGCAAAGCT 


AGTCATCCCA 


TCATACATAG 


5580 




AAGAATTTGC 


TACATCCATA 


TCTGTTAATT 


CACAAATTAA 


AGTTTGGAAC 


TCAAAAATGG 


5640 




CTTGTAATTC 


ACCTTGAGAA 


ATTTCCGGTT 


GATATGGCGT 


ATATGCTGTG 


TAAAATTCTG 


5700 


50 


ATCTTGAAAT 


CATAGCATCC 


ACAACTGATG 


GCGCGTAATG 


ATCATAAACA 


CCAGCACCCA 


5760 




rAAATGATGT 


ATGCGTTTCT 


TTAGTGATAT 


tCTTGCTkGC 


AATGGGGATT 


TAAACllTCTA 


5820 
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(2) INFORMATION FOR SEQ ID NO: 67: 

(i) SEQUENCE CHARACTERISTICS : 

<A) LENGTH: 18355 base pairs 
5 <B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

10 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 67: 

ATnATAATTG GCTTTGCTAA TAATTACTTC CCTGAATTAC aAGTATTAGC AAACGAAATA 60 

AAATCTGATA TGGCTAGTTC ATTAAAACAA TGATATTTTT ATTTAAATTT TTaAAGCTTT 120 

1S 

GTACGAAATT GTACAAAGCT TTTTTGGTGC GTATTGTATG GGCAACAACT TGACGATGAA 180 

AATCCGTTAC AGGATTGGTA ATAGGAAATG TTAGCGAAAG ACAAGGGTAT CCATTGTAGA 24 0 

20 TTAACAAAAG GACGTTTCCA CAAGTGTGGG TTATTCTCAC TAAAGCAATA CGCAGAGACA 300 

ACTTACGTAA AATTTTGAAC TGACTAGAAC GGAACTTCTA CTCAATTATT GATAAAAATT 360 

TTCAAAAAGA CTTGAATGTG CTGAGAATAC GAAGTTTATG GAAGGATTAT CAAAATATAA 42 0 

25 ATGTGCATTC ATTTACAACC TTTATTGACA ATGATTCTCA ACTAATATAG TATATAATCA 4 80 

AATCGTAATA GTTACGATTT GTTTTCTGCA ACTTTTTTGA AGTTTTAGTT GAGGTGAAAA 54 0 

CAATAAAAGC ATCTAAGTGA ATGTAGTTAA CGGACAACTG CATTCGCTTG TAGAGCCACA 600 

30 

AGAAGCAACT TTAAATAAGG TTTACGGTTG CATTTTGATA CAACAACCGA TTACTAAGTC 660 

ATGCTTTCCA CTTTGCGGGT TAGCATGACT TACCTAATAG ATAGAGCTAT TAGGTTCAGC 720 

TTCTAAAAAA TTACAGTTTT AGAGGAATAC AGTTGcTTGc t TCG CAACAA CTGCATAAGA 780 

GCCATGGTTT TCGCTTTTGC GAATT AG CAT GACTTACCTA CTAGATAGAG CTATTAGGTT 840 

CATCTTCTAA AAAATTACAG GTTTAGAGGA ATACAGTTGT TTGcTTCGCA ACAACTGCAT 900 

AAGAGCCTCT AGTAATTAAA ATTACAGAGG CTCTAAAAAT ACATCTAAAG GAGTGTCGTA 960 

40 

TGAATCGGCA GGTTATAGAA TTTTCTAAGT ATAATCCTTC GGGGAATATG ACGATACTTG 1020 

TTCATTCAAA ACATGATGCT AGTGAATATG CATCTATCGC CAATCAGTTG ATGGCCGCAA 1080 

45 CACATGTATG CTGTGAACAG GTAGGCTTTA TAG r ATCAAC ACAAAATGAT GATGGTAATG 114 0 

ATTTTCACTT AGTTATGAGC GGTAATGAAT TTTGCGGTAA TGCGACGATG TCATATATAC 1200 

ATCATTTGCA GGAAAGTCAT TTGCTTAAAG ACCAACAGTT TAAGGTGAAG GTGTCTGGCT 1260 

50 GTTCGGATTT AGTGCAATGC GCAATTCATG ATTGCCAATA CTATGAAGTT CAAATGCCAC 1320 

AAGCCCATCG TGTTGTGCCA ACAACAATTA ATATGGGTAA TCATTCATGG AAAGCAATAG 1380 
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TTCAACATTT 


GGTTGAAGCG TTTGTGCGTG AgcAACAATG GAGTCACAAA TATAAAACAG 


1500 




TAGGTATGAT 


GCTTTTTGAT 


GAACAACGTC 


AATTTTTACA 


GCCATTAATC 


TATATACCAG 


1560 


5 


AAATTCAAAG 


TTTAATTTGG GAAAATAGCT GTGGTTCTGG TACAgcATCA ATTGGGGTTT 


1620 




TTAATAATTA 


TCAACGTAAT 


GACGCATGCA 


AAGATTTTAC 


AGTACATCAG 


CCAGGGGGCA 


1680 




GTATTTTAGT 


GACATCAAAG 


CGATGTCATC 


AATTGGGATA 


TCAAACTTCA 


ATTAAAGGAC 


1740 


10 


AGGTTACAAC 


TGTAGCTACA 


GGaAAAGCAT 


ATATAGAATA 


AGGAGCCTAC 


AATGAATAAC 


1800 




TTTAATAATG 


AAATCAAATT 


GATATTACAA 


CAATATTTAG 


AAAAGTTTGA 


AG CGCATT AC 


1860 


IS 


GAGCGTGTAT 


TACAAGACGA 


TCAATATATC 


GAAGCATTAG 


AAACATTGAT 


GGATGACTAT 


1920 


AGTGAATTTA 


TTTTAAATCC 


TATTTATGAA 


CAACAATTTA 


ATGCTTGGCG 


TGACGTTGAA 


1980 




GAAAAAGCAC 


AATTaATAAA 


ATCACTGCAA 


TATATTACAG 


CGCAGTGTGT 


TAAACAAGTG 


2040 


20 


GAAGTCATTA 


GAGCGAGACG 


TCTATTAGAC 


GGACAGGCGT 


CTACCACAGG 


TTACTTTGAC 


2100 




AATATAGAAC 


ATTGTATTGA 


TGAAGAGTTT 


GGACAATGTA 


GTATAGCTAG 


CAATGACAAA 


2160 




TTATTGTTAG 


TTGGTTCAGG 


TGCATATCCA 


ATGACGTTAA 


TTCAAGTAGC 


AAAAGAAACA 


2220 


25. 


GGTGCTTCAG 


TTATCGGTAT 


TGATATTGAT 


CCACAAGCCG 


TTGACCTAGG 


GCGCAGAATC 


2280 




GTTAACGTCT 


TAGCACCAAA 


TGAAGATATA 


ACAATTAOGG 


ATCAAAAGGT 


ATCTGAACTT 


2340 




AAAGATATCA 


AAGATGTGAC 


GCATATCATA 


TTCAGCTCGA 


CAATTCCTTT 


AAAGTACAGC 


2400 


30 


ATTTTAGAAG 


AATTATATGA 


TTTAACAAAT 


GAAAATGTCG TAGTTG CAAT GCGCTTTGGT 


2460 




GATGGCATCA 


AAGCAATATT 


TAATTATCCG 


TCACAAGAAA 


CAGCGGAAGA 


TAAGTGGCAA 


2520 


35 


TGTGTGAATA 


AACATATGAG 


ACCACAGCAA 


ATTTTTGATA 


TAGCACTTTA TAAAAAAGCA 


2580 


GCTATAAAGG TAGGTATTAC GGATGTCTAA ATTATTAATG. ATAGGCACTG GTCCgGTCGC 


2640 




AATGCAATTA 


GCGAATATTT 


GCTATTTAAA 


ATCAGATTAT 


GAGATTGATA 


TGGTTGGACG 


2700 


40 


TGCCTCAACA 


TCAGAAAAAT 


CAAAACGCTT 


ATATCAAGCG 


TATAAAAAAG 


AGAAACAATT 


2760 




TGAAGTCAAA 


ATACAAAACG 


AGGCGCATCA 


ACATCTGGAA 


GGTAAGTTTG 


AAATTAATCG 


2820 




TTTGTATAAA 


GATGTTAAAA 


ACGTTAAGGG 


TGAATACGAA 


ACGGTTGTCA 


TGGCATGCAC 


2860 


45 


AGCAGATGCT 


TATTATGACA 


CACTACAGCA 


ATTGTCGTTA 


GAAACTTTGC 


AAAGTGTCAA 


2 34 0 




ACATGTCATT 


TTAATATCAC 


CGACATTTGG 


TTCGCAAATG 


ATTGTCGAAC 


AATTTATGTC 


3000 




TAAATTTAAT 


AAAGATATCG 


AAGTGATTTC 


ATTCTCAACT 


TATCTTGGCG 


ATACACGTAT 


3060 


60 


TGTTGATAAA 


GAAGCGCCTA 


ATCATGTGTT 


GACAACAGGT 


GTAAAAAAGA 


AATTGTACAT 


3120 




GGGATCGACA 


CATTCAAACT 


CAACAATGTG 


TCAACGAATC 


TCTGCTTTAG 


CTGAGCAATT 


31B0 
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TTATGTGCAC CCACCACTAT TTATGAATGA 
AGATGTACCQ GTTTATGTGT ATAAGTTATT 
5 CCGTGAAATG CGTTTAATGT GGAAGGAAAT 

GTCAGTCAAC CTGCTTCAAT TTATGGTGAA 
GGATGAAGGT GATATTGAGC ATTTCGAAAT 

10 

TTATGTAAGA TATACCGCAA TCCTCATTGA 
TTACTTTGAT TTTTCAGCTG TACCATTTAA 
TCAAATTCCA AGAATGCCAA GTGAAGATTA 

15 

GAAAATGCTA GGTATCAAAA CGCCAATGAT 
TTGCCAGGCG TACAAGGATA TGCATCAAGA 

20 TCTATTTGAA GGAGATAAAG CACTCGTCAC 

ATAATAAGGG TTTGAAGTTT TATAATAGAA 
ATAAAAATAA GCAAATAATT GAGAAAAATA 

25 TATCAATTTA GAAAGAGGAA AAGCAAATGA 

TTGCATCAGG GCTAATTTTA ACTGGTTGTG 
AAAACAAGCA ATTAACGTAT ACGACGGTTA 

30 

ACGGTGGATC AATGTCTGCT GAAAGTATGA 
ATGGTATTAA GCCTTTACTA GCTAAAAAGT 
CGTTCCATTT GAGAGATGAC GTTAAATTCC 

35 

GTTAAGAAAA ATATTGACGC AgTTCAAGAA 
TCGACATTAA TTGACAATGT TAAAGTTAAA 
GAAG CAT ATC AACCTGCATT GGCTGAATTA 

40 

CCAAAAGACT TTaAAAACGG TACAAcAAAA 
CCATTTAAAT TAGGTGAACA CAAAAAAGAT 
45 TACTGGGGCG AAAAGTCTAA ACTTAACAAA 

ACAGCATTCC TATCAATGAA AAAAGGTGAA 
ACAGATAGCT TAGACAAAGA CTCTTTAAAA 

SO 

AAGCGTAGTC AACCTATGAA TACGAAAATG 
GCTGTGAGTG ACAAAACAGT CAGACAAGCG 

SS 



CTTTTCATTG AAAGCCATTT TCGAAGGAAC 3300 

TCCTGAAGGA CCGATAACGA TGACACTAAT 3360 

GATGGTTATT TTACAAGCAT TTAGAGTGCC 3420 

GGAAAATTAT CCAGTACGTC CTGAAACTTT 34 80 

CTTGCCAGAT ATCTTACAAG AATATCTGCT 3540 

TCCATTTTCA CAGCCAGACG AAAACGGACA 3600 

GCAAGTCTAT AAAAATGAAC AGGATGTTGT 3660 

TTACAGAACG GCGATGATTC AGCATATTGG 3720 

TGATCAGTTC CTAACTCGCT ATGAAGCAAG 3780 

TCAACACTTA TCTTCTCAAT TTAATACAAA 3840 

AAAATTTTTG GAAATCAATA GAACGCTTTC 3900 

AAAAATTATT GAATTATGTT TGACATTTAC 3960 

ATCATTACGA TTTQATTAAG TAATGCAACT 4020 

GAAAACTAAC TAAAATGAGT GCAATGTTAC 4 080 

GCGGTAATAA AGGTTTAGAG GAGAAAAAAG 414 0 

AAGATATCGG TGATATGAAT CCGCATGTTT 4200 

TATACGAGCC GCTTGTACGT AACACGAAAG 4260 

GGGATGTGTC TGAAGATGGG AAGACATACA 4 320 

ATGATGGTAC GCCATTTGca TGctGACGCA 4380 

AACAAAAAAT TGCATTCTTG GTTAAAGATT 4440 

GATAAGTACA CGGTTGAATT GAATTTGAAA 4500 

GCGATGCCTC GTCCATATGT ATTTGTGTCT 4560 

GATGGCGTTA AAAAGTTCGA TGGTACTGGT 4620 

GAGTCTGCAG ACTTTAACAA AAATGATCAA 4 680 

GTACAAGCAA AAGTAATGCC TGCTGGTGAA 4740 

ACGAACTTTG CCTTCACAGA TGATAGAGGT 4600 

CAATTGAAAG ATACAGGTGA CTATCAAGTT 4860 

TTAGTTGTCA ATTCTGGTAA AAAAGATAAC 492 0 

ATTGGTCATA TGGTAAACAG AGATAAAATT 4 980 
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ACAGACATTA ATTTCGATAT 


GCCAACACGT 


AAGTATGACC 


TTAAAAAAGC 


AGAATCATTA 


5100 




TTAGATGAAG 


CTGGTTGGAA 


GAAAGGTAAA GACAGCGATG 


TTCGTCAAAA 


AGATGGTAAA 


5160 


5 


AACCTTGAAA TGGCAATGTA 


CTATGACAAA 


GGTTCTTCAA 


GTCAAAAAGA 


ACAAGCAGAA 


5220 




TACTTACAAO 


CAGAATTTAA 


GAAAATGGGT 


ATTAAGTTAA 


ACATCAATGG 


CGAAACATCA 


5280 




GATAAAATTG 


CTGAACGTCG 


TACTTCTGGT 


GATTATGACT 


TAATGTTCAA 


CCAAACTTGG 


5340 


10 


GGATTATTGT 


ACGATCCACA 


AAGTACTATT 


GCAGCATTTA 


AAGAGAAAAA 


TGGTTATGAA 


5400 




AGTGCAACAT 


CAGGCATTGA 


GAACAAAGAT 


AAAATATACA 


ACAGCATTGA 


TGACGCATTT 


5460 


IS 


AAAATCCAAA ACGGTAAAGA 


GCGTTCAGAC 


GCTTATAAAA 


ACATTTTGAA 


ACAAATTGAT 


5520 


GATGAAGGTA TCTTTATCCC 


TATTTCACAC 


GGTAGTATGA 


CAGTTGTTGC 


ACCaAAAGAT 


5580 




TTAGAAAAAG 


TATCATTCAC 


ACAATCACAG 


TATGAATTAC 


CATTCAATGA 


AATGCAGTAT 


5640 


SO 


AAATAAAGGA 


GCAATTAGAT 


GTTCAAATTT 


ATCTTAAAAC 


GTATTGCGCT 


CATGTTTCCA 


5700 




TTGATGATTG 


TAGTAAGTTT 


TATGACATTT 


CTATTGACGT 


ATATTACAAA 


TGAAAATCCA 


5760 




GCTGTGACAA 


TTTTACATGC 


ACAAGGGACG 


CCAAATGTAA 


CACCAGAGTT 


GATTGCAGAA 


5820 


2S 


ACGAATGAGA 


AGTACGGTTT 


CAATGATCCA 


TTATTAATTC 


AATATAAAAA 


TTGGTTACTT 


5860 




GAAGCGATGC 


AATTTAATTT 


TGGTACAAGC 


TACATTACAG 


GTGACCCAGT 


TGCTGAACGT 


5940 




ATTf3<VPf*f*Aft 
nx x w x 


\— riX X lAlunn 


TACATTGAAA 


TTAACAATAA 


TTTCAAGTGT 


TATGGTGATG 


6000 


30 


ATTACATCAA 


TTATTTTAGG 


TGTAGTTAGT 


GCATTAAAAA 


GAGGAAAGTT 


- CACTGATCGT 


6060 




GCGATACGTT 


CAGTGGCTTT 


CTTTCTAACT 


GCATTACCAT 


CATATTGGAT 


AGCTTCAATA 


6120 


35 


CTTATTATTT 


ACGTTTCAGT 


GAAGTTAAAC 


ATATTGCCGA 


CTTCTGGATT 


AACAGGTCCA 


6180 


GAAAGTTACA 


TATTGCCAGT 


GATCGTTATT 


ACGATTGCCT 


ATG CTGGTAT 


TTACTTTAGA 


6240 




AATOTTAGAC 


GCTCGATGGT 


GGAACAATTA 


AATGAAGATT 


ATGTACTTTA 


TTTAAGAGCA 


6300 


40 


AGCGGTGTGA 


AATCTATCAC 


ATTAATGTTG 


CATGTGTTGC 


GTAATGCTTT 


ACAAGTTGCG 


6360 


GTATCAATCT 


TTTGTATGTC 


TATACCAATG 


ATAATGGGTG 


GACTAGTTGT 


TATCGAGTAT 


6420 




ATCTTTGCAT 


GGCCTGGACT 


AGGTCAATTA 


AGTTTAAAAG 


CAATACTTGA 


ACACGATTTT 


64 80 


4S 


CCAGTCATTC 


AAGCATATGT 


ATTAATTGTA 


GCGGTATTAT 




lAAlAuAi IA 


6540 




GCAGATATCA 


TTAATGCGCT 


ATTAAATCCA 


AGATTAAGGG 


aGGGCGCACG 


ATGATAATTT 


6600 




TAAAmCGATT 


ATTmCArGwT 


AAAGGTGCAG 


TAATTGCTTT 


AGGCATTATT 


GTATTATATG 


6660 


SO 


TCTTTTTAGG 


ATTAGCAGCA 


CCACTTGTGA 


CATTTTATGA 


TCCTAACCAT 


ATCGATACAG 


6720 




CAAACAAATT 


TGCTGGCATG 


AGTTTTCAAC 


ATCTACTAGG 


TACTGACCAT 


TTAGGTAGAG 


6780 
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TATTTGTTTC TGTACTTATT GGATCTATTT TAGGATTCTT ATCAGGATAT TTCCAAGGGT 6900 

TTGTTGACGC CTTAATCATG CGTQCGTGTG ATGTTATGTT GOCATTCCCA AGTTATGTTO 6960 

5 TAACGTTAGC ATTAATTGCA TTGTTTGGAA TGGGTGCCGA AAATATTATC ATGGCATTTA 7020 

TTTTG ACGCG TTGGGCATGG TTCTGTCGTG TTATACGTAC AAGTGTTATG CAGTACACTG 7080 

CTTCTGACCA TGTAAGATTT GCTAAAACAA TCGGTATGAA TGATATGAAA ATTATTCACA 714 0 

10 

AACATATTAT GCCATTAACA TTAGCAGATA TTGCTATCAT CTCTAGTAGC TCGATGTGTT 7200 

CAATGATCTT GCAAATATCT GGCTTTTCAT TTTTAGGATT AGGTGTCAAA GCGCCTACTG 7260 

CAGAGTGGGG CATGATGCTT AACGAaGCTA GAAAAGTGAT GTTTACACAT CCTGAAATGA 7320 

15 

TGTTTGCGCC AGGTATTGCC ATAGTGATTA TAGTGATGGC ATTTAACTTC TTATCCGATG 7380 

CTTTACAAAT TGCTATTGAT CCCCGCATCT CTTCTAAAGA TAAACTTCGT TCTGTGAAAA 7440 

2Q AAGGAGTGGT GCAATCATGA CATTGTTAAC AGTTAAACAT TTGACGATTA CAGATACCTG 7500 

GACAGATCAA CCACTCGTGA GTGATGTGAA TTTTACATTA ACTAAGGGTG AAaCTTTAGG 7560 

CGTTATTGGA GAAAGTGGTA GTGGTAAATC AATCACTTGT AAATCGATTA TTGGTTTGAA 7620 

25 TCCCGAACGA CTCGGGGTGA CAGGTGAAAT TATCTTTGAT GGTACAtCAA TGTTGTCATT 7680 

ATCTGAATCG CAATTGAAAA AGTACCGTGG TAAAGACATT GCGATGGTCA TGCAACAAGG 7740 

TAGTCGTGCC TTTGACCCAT CAACTACTGT CGGTAAACAA ATGTTTGAGA CTATGAAAGT 7800 

30 ACATACGTCA ATGTCTACAC AAGAAATTGA AAAGACATTG ATTGAATATA TGGATTATTT 7860 

AAGTTTGAAA GATCCTAAAC GTATATTAAA ATCATACCCT TACATGTTAT CAGGAGGAAT 7 920 

GTTACAGCGA TTGATGATTG CTTTAGCGTT Ag C TTTg AAA CCAAAGTTAA TCATTGCTGA 7980 

35 TGAGCCGACA ACGGCTTTAG ATACAATTAC ACAATATGAT GTACTGGAAG CATTTATAGA 8040 

TATT^AAAAA CACTTTGACT GTGCGATGAT TTTCATTTCA CATGATTTAA CGGTTATTAA 8100 

CAAGATTGCA GACCGTGTTG TTGTGATGAA AAATGGTCAG CTTATTGAAC AAGGGACACG 8160 

40 

TGAATCAGTC TTG CAT CATC CAGAACATGT TTATACGArt ATTkTATTAT CAACGAAGAA 8220 

GAAGATTAAT GATCATTTTA AACATGTGAT GAGGGGTGAT GTACATGATT AAAATTAAAG 8280 

ATGTTGAAAA GTCATATCAA AGCGCACATG TTTTTAAGCG TCGTOGAACA CCTATCGTGA 6340 

45 

AAGGTGTGTC ATTTGAGTGT CCAATCGGTG CGACGATTGC GATTATCGGA GAAAGTGGTA 8400 

GCGGTAAATC GACGTTGAGT CktATGATAT TAGGTATTGA GAAACCGGAT AAAGGTTGTG 8460 

60 TAACCTTAAA TGATCAACCG ATGCATAAGA AGAAAGTGAG ACGTCATCAA ATTGGTGCTG 8 520 

TATTTCAAGA TTATACGTCA T CATT AC AT C CATTTCAGAC TGTTAGAGAA ATCTTATTTG 8580 
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TGTTGGAAGA AGTCGGTCTA TCTAAGGCAT ACATGGATAA ATATCCTAAT ATGTTATCAG 8700 

GTGGAGAGGC GCAACGTGTT GCGATTGCGC GTGCAATATG TATTAACCCT AAATATATTT 8760 

TGTTTGATGA AGCCATTAGT TCACTCGACA TGTCAATTCA AACACAAATA TTAGATTTAT 8820 

TGATTCATTT ACGTGAAACG CGTCAGTTGA GTTATATTTT TATCACACAT GATATTCAAG 8880 

CTGCCACGTA TTTATGTGAT CAATTAATTA TTTTTAAAAA CGGAAAAATA GAAGAACAAA 8940 

TTCOOACAAG CGCATTGCAT AAAAGTGACA ATGCTTATAC AAGAGAATTA ATAGAAAAAC 9000 

AACTATCATT CTAAGGAGTG AGATAATGAA AGGTGCAATG GCTTGGCCCT TTTTGAGATT 9060 

ATATATATTA ACATTGATGT TCTTTAGTGC CAATGCAATC TTAAACGTGT TTATACCTTT 9120 

ACGAGGGCAT GATTTAGGCG CAACGAATAC GGTTATCGGT ATCGTTATGG GGGCATACAT 9180 

GTTAACAGCA ATGGTATTTC GACCATGGGC AGGACAAATT ATTGCTCGTG TCGGTCCCAT 9240 

TAAAGTATTA AGAATTATTT TGATTATCAA TGCCATAGCT TTAATTATTT ATGGTTTTAC 93 00 

TGGCTTAGAA GGTTATTTCG TAGCACGTGT TATGCAAGGT GTGTGTACGG CATTCTTTTC 9360 

TATGTCTTTA CAGCTAGGTA TTATTGATGC ATTACCAGAG GAACATCGTT CTGAAGGTGT 9420 

ATCATTGTAC TCGCTATTTT CAAOGATTCC AAACTTAATC GGACCATTAG TTGCCGTAGG 94 80 

TATTTGGAAT GCAAATAATA TTTCACTATT TGCAATTGTC ATTATCTTTA TCGCATTAAC 9540 

AACAACATTC TTTGsTATGG CGTGACCTTT GCTGAAGAGG AACCCGATAC GTCAGATAAG 9600 

ATTGAAAAAA TGCCGTTTAA CGCTGTAACT GTTTTTGCGC AATTTTTCAA AAATAAAGAG 9660 

TTGTTGAACA GTGGTATTAT CATGATTGTT GCATCGATTG TATTTGGTGC AGTTAGTACA 9720 

TTTGTACCGT TATACACAGT GAGTTTAGGA TTCGGGAATG CGGGAATCTT TTTGACAATA 9780 

CAGGCCATCG CAGTTGTTGC GGCAAGATTT TACTTAAGGA AATACATTCC- GTGAGATGGT . 984 0 

ATGTDGCATC CTAAATATAT GGTATCTGTA CTATCATTAT TAGTAATCGC GTCATTTGTA 9900 

GTGGCATTTG GTCCGCAAGT AGGTGCAATT ATTTTCTATG GTAGTGCGAT ATTAATAGGA 9960 

ATGACGCAAG CAATGG TGTA CCCAACATTA ACATCATACT TAAGCTTCGT CTTACCAAAA 10020 

GTAGGTCGTA ATATGTTGTT AGGTTTATTT ATTGCCTGTG CAGACTTAGG TATATCGTTA 10080 

GGTGGCGCAT TGATGGGACC TATTTCCGAT TTAGTAGGAT TTAAATGGAT GTATCTAATT 1014 0 

TGTGGTATGT TAGTCATTGT AATAATGATT ATGAGTTTCT TGAAAAAGCC AACACCACGT 10200 

CCAGCGAGTA GTCTTTAATG AAGTGAATTA AAGCATATTA AGTTAATGAA TATTTAAATT 10260 

TTAAAAGGTA TATTGaGCAT GGCGATTCAT GTGCTTCATG CTAGGACATG AAACATTCTA 10320 

TATGGCTCGT TTTTAGAACG ACAtATATCT AAATAAAGCA CGCTTArAAG TGAGTTTTGA 10380 
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TTACATGAAA ATATGCAAAA CGAGTATAAC TGCTAATTOA TAGAAATAGC TCACCATAAA 10500 

ATTACGGTAT GATTTTAAAT ATAAGTAAGT CGCACTACCT GCTAGTATCA ATGCTGGAAT 10560 

GAATTCCCAC CATGTATTAA TGTATGGATA GTAGAACAGA GTTTCAAGGA TAATGGACAA 10620 

TACTATTGTA ATCTTTAAAG GTATTAATCT GCTTAATTCT TGAATTAAAA TATGACGGAA 10680 

AATAAGTTGA CAAATCAAAG TATTTAATAT AATGGTTAAC GAAAATATAG CTATTAAACT 1074 0 

GATGGAaCCA TACCCTTTAA TGAGCGGGTA AATGTCAAAG ACAGTAAAGG AATCTACATT 10800 

TAGTGCGAAA ATATTGAAAT GATTTAAAAG TAAAAAGAGT ACGACACTTA GTGTAAATGA 10860 

TATAAGAATA TGCCATTTAT ATTTAGCACT AG CAACGATT TGCGAACGTA TCATTGGAAT 10920 

AAACGCATCT TCATGCATCA GACGAAAAAT AGCTAGTGAA ATAATAACTG CGAGTAAATA 10980 

GCTAATGTTC ATTGAAATAG GAAAAGAGAA ACCCCACGGA GCTTGTTGAG TGAATACAGC 11040 

TACTAACCCA AAAGTTAAAA AGACGATAAT GATCGGCAAG ATGTTAACCA AAAATATGTA 11100 

AAGGAAAATA AATCCAATAT CACGTTTGAA AAAACGCGAT TGTTCGGTAG CGTATTCTTC 11160 

TTCTATGTAA TGTTTATTTG TATTTGACAT AGTATACCTC TTAAATAGTT GTATTATATA 11220 

GATACTTTAG CACATATTAC TTTGTATTGT ATGTTTTATA CATTAAAATT TAAAATGAAA 11280 

AACAT AT CAT AAAATTGTTT TATAAAATGA AGCGCTTCCA TTGTGTTTTG TTTTGTAAGG 11340 

TGTATCATAA ATATTGAATT GAAATTTTGG GGGGAGGTAT TGTAATGACG TTTCTTACAG 114 00 

TCATGCAATT TATAGTTAAC ATTATCGTTG TAGGATTCAT GCTTACGGTT ATTGTTATCG 11460 

GGCTTATTTG GTTAATTAAA GATAAAAGAC AATCACAACA TAGTGTATTA AGGAATTATC 11520 

CTTTACTAGC ACGTATTAGA TATATTTCAG AAAAAATGGG ACCGGAATTA CGTCAGTATT 11580 

TATTTTCTGG GGATAATGAA GGGAAACCTT TTTCACGTAA TGATTATAAA AATATCGTTT 11640 

TGGCfGGAAA ATATAACTCT CGTATGACCA GCTTCGGTAC TACTAAAGAT TATCAAGACG 11700 

GCTTTTACAT ACAGAACACA ATGTTTCCGA TGCAACGTAA TGAGATTTCA GTAGATAATA 11760 

CAACATTGTT ATCAACATTC ATTTATAAAA TCGCGAATGA GCGTTTATTT AGTCGTGAAG 11820 

AATATCGTGT GCCGACAAAG ATTGATC CGT ATTACTTAAG TGATGACCAT GCAATAAAAT 11880 

TAGGTGAACA TTTAAAACAT CCATTTATTT TAAAACGTAT CGTAGGACAA TCTGGTATGA 11940 

GTTATGGCGC TTTAGGAAAA AATGCCATTA CAGCTTTATC TAAAGGTCTA GCTAAAGCGG 12000 

GCACTTGGAT GAATACAGGT GAAGGTGGCT TATCAGAATA TCATTTAAAA GGTAATGGGG 12060 

ATATCATTTT CCAAATTGGT CCCGGTTTAT TTGGTGTTCG TGATAAAGAA GGTAATTTTA 12120 

GTGAAGGTTT ATTTAAAGAG GTTGCACAGT TATCTAACGT ACGCGCATTT GAGCTGAAGT 12180 
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TTGCTAAAAT CCGAAATGTT GAACCTTATA AAACAATCAA TTCACCTAAC 


CGTTACGAAT 


12300 




TTATTCATAA TGCTGAAQAT TTGATTCGTT 


TCGTCGATCA 


. GTTGCAGCAA 


TTAGGTCAAA 


12360 


5 


AACCAGTAGG ATTCAAAATT GTAGTAAGCA AAGTTTCAGA AATTGAAACA 


CTTGTACGTA 


12420 




CGATGGTGGA ACTAGATAAG TATCCAAGCT 


TTATTACGAT 


TGATGGTGGT 


GAAGGTGGTA 


12480 


10 


CTGGTGCAAC ATTCCAAGAA TTACAAGATG 


GTGTTGGCTT 


ACCGCTATTT 


ACAGCTCTAC 


12540 


CTATTGTGTC TGGCATGTTA GAAAAATATG 


GTATTCGAGA 


TAAAGTGAAA 


TTGGCGGCAT 


12600 




CTGGTAAGTT AGTGACACCA GATAAAATTG 


CGATTGCACT 


AGGTTTAGGT 


GCAGATTTTG 


12660 


IS 


TAAATATCGC ACGTGGGATG ATGATTAGTG 


TCGGTTGTAT 


AATGAGTCAA 


CAATGTCACA 


12720 




TGAATACGTG TCCTGTAGGT GTTGCAACGA 


CAGATGCGAA GAAAGAAAAA 


GCATTGATTG 


12780 




TTGGAGAAAA GCAATATCGT GTCACAAACT 


ATGTAACAAG 


TTTGCATGAA 


GGCTTATTCA 


12840 


20 


ATATTGCAGC AGCTGTTGGC GTATCCAGTC 


CTACAGAAAT 


TACTGCTGAT 


CAT ATTGT AT 


12900 




ATCGAAAAGT CGATGGTGAG TTACAAAOGA 


TACATGATTA 


TAAATTAAAA 


CTCATTAGTT 


12960 




AACTTAATTA TTTCGGGAAA TTGAAAGCAG CGGATTTTAG 


CGTTACTGCA 


AATAATTTTA 


13020 


25 


TATTAGTAGT GGATGCTGGT CACACAAGAA 


CTTCAAATAT 


TAAAGCCCTC 


AGAATATGAA 


130B0 




TTAAGGTTTG TAACCTTAGT CTTATCTGAG 


GG CATTTTTA 


AGTTATAAAC 


TATTTGTCGT 


13140 




CCATTTTATC TTTTTCTTTT AAACCTCTGT 


GCTTTAATTG 


CTTTTCAAGT 


TTTTCAAAAC 


13200 


30 


TAATATCTTT ATTTTCTTTA GTCGAAACAC 


CAAGACGTTT 


ATTTAATTTT 


TTCATGTCAA 


13260 




CTTCTGTGTA ATCTATGTCT AAGTGyTCAA TTGCTTTTTT ATCTTTATAG TCTACTTTGT 


13320 


35 


ATTTTACGCC TTTAAGGTCT TTGAAAATAC 


TTTCAGATTT 


GGCGAATAAC 


TTTTTGGCTT 


13380 


OGTCTTTATC CATACCTAGA TCGTCATATT 


TAATTGTGTT 


GATTGTAGAC 


TGTTTTAAAA 


" 13440 




CTrtATCATC TTTATATGTG ATAGAAGTTA 


GTACATGTTT 


ACCACTAACA 


TCACCwTCAT 


13500 


40 


ATGTTTTGGT TTGTTCTTTA CCACAAGCTG 


ATAATGCAAT 


GATACAAACT 


AATGCTACTA 


13560 




CAATTAATGA ACATAATTTT TTCAAAGTCA 


GTCGCCTTCT 


TTCGATATTT 


GTATTATAAA 


13620 




GAAATTATAA CATTTACTAA AAAATGATGT 


TATTCAAAAA 


TTTAAATTTT 


GTCATTTTTT 


13680 


45 


TTGAAGATAT GAGTTTTTTT AAGCGGATTC 


CTCACAAAAT 
TGAAAGTTAG 


TTTAAAAATA 


TTTAAGCCTk 


13740 




AAAATGATAA AGCGkTAGGG AACGTTTTTC 


TGATACAATA 


GTTTTAAGTT 


13800 




GAAATACAGG AGGATGAATA ACATGAATCA 


GTCAGTCAAA 


TTACTTAAAC 


ATTTAACAGA 


13860 


SO 


TGTAAACGGC ATTGCTGGTT ATGAAATGCA AGTTAAAGAA 


GCAATGCGTa 


ACTATATAGA 


13920 




GCCTGTCAGT GATCAAATTA TTGAAGATAA 


CTTGGGTGGC 


ATTTTTGGAA 


AGAAAAATGC 


13980 
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AACAAAGATT GATAAACATG GTTTTATTTC 
GTCATGCTAT CTCAAAAAGT AACGATTACA 
5 ATCGGTTCTA AACCGCCACA TGTCTTAACG 

AAAAATATGT TTATAGATAT TGGTGTTAGT 
GAAGTAGGCA ATATGGTTAC GCCATATAGT 

10 

TTAACTGCGA ArCATTTGAT AATCGCTATG 
GTTTAAAAGA TGAAAATATT GGCATTAACT 

is TTGGTTTGCG TGGTGCGAAA GTGGCAGCGA 

TcGATGTAGG TATTGCTTAT GATACCCCAG 
TAGGCGGTGG TCCAGTTGTC ATTATGATGG 

20 GAAAg C ATaT TAAAGATGTA GCTAAGGAAC 

CAGGTGGAGG TACAGATGCG GGAAGTATTC 
CAATCGGTGT TACGCTGCGA TACATGCATT 

25 ATGAAAATTC TATCCGTCTT GTTACTGAAA 

AAAATATCAT GTGGTAATCA AATCCATAAA 

GTTAAACAAT TGTCTAATTT TAATTCTTAG 

30 _ : ._ 

TTTTGTTTTT AATTTAAATG CTGAAAATCA 

ATGATTTTTT CTTAAATGTA ATTGCACTAA 

TATATTACAT GAGGAGCGGT GCAAATGTTG 

35 

AGCGATAGAA T CAT ACTAGA TCATATCAGT 
ATT AT AGG T C CAT CAGGT AG TGGTAAAAGT 
AGTCCAACTA GTGGAGAACT TTATTTTAAA 

40 

GAATTGCGTC AACGAATCAG TTATTTGATG 
GAAGATAACA TGATATTCCC ATCACTTGCA 

45 AAGCAATTAA TTAAAGATGT CGGTTTGGGA 

ATGTCGGGTG GTGAGCGGCA AAGAATTGCT 
ATTCTTTTAT TAGATGAATC GACCAGTGCA 

50 AATATCATTT TTAAATTAGC AG AT CAAGG C 

GACCAAAGTA TGCGACACTT TCAAAAGCGT 

55 



ATTTACGCCA kTgGTGGATG GTGGAATCAA 


14100 


ACAGATTCGG 


GCAAAGAAAT 


TAGAGGTATC 


14160 


CCTGAAGAAC 


GTAAAAAGCC 


AATGGAAATC 


14220 


AGCAAGGAAG 


AAGCTGAAGA 


AGCTGGCGTT 


14280 


GAATTTGAAG 


TGCTTGCAAA 


TGATAAATAT 


14340 


GCTGTGCATT 


AGCTATTGAG 


GTATTAAAAC 


14400 


TATACAGTGG 


TGCCACAGTG 


CAAGAAGAAG 


14460 


ATACGATTAA ACCAGACTTG GCGATAgcTG 


14520 


GTATGTCAGG 


TCAAACGAGC 


GATAGTAAAC 


14560 


ATGCTACAAG 


TATTGCTCAC 


CAAGGTTTGC 


14640 


ATAACATCGA 


AGTACAATGG 


GATACGACAC 


14700 


ATGTCGCAAA 


TGAAGGTATT 


CCAACGATGA 


14760 


CTAATGTTTC 


AGTGCTCAAT 


GTAGATGATT 


14820 


TTGTC CGTT C 


ATTGAATGAT 


GAAAGTTATA 


14880 


TAATAAAGAA 


TCCTTTTAAT 


ATGGTAGGTT 


14940 


TCATTAGACA 


GTATCCATGT 


TAATAGGATT 


15000 


ATTATGCCTA 


AATTTTGATA 


TTACAAGAAA 


15060 


AAACCAAAAA 


AACGGGAATA 


ATATACCTGA 


15120 


TTAGAAATTA 


AAGATTTAGT 


GTATAAAGCG 


15180 


CTAAAAGTAG 


ATAAAGGCGA 


GAGTATTGCC 


15240 


ACATTTCAAA 


AGCAAATATG 


TAATTTGTTT 


15300 


GGTAAACCCT 


ATAATGATTA 


TGACCCGGAA 


15360 


CAGCAAAGTG 


ACTTGTTTGG 


TGAAACGATT 


15420 


CGTAATGATA 


AATTTGATAG 


AAAACGTGCA 


15480 


CATTATCAAT 


TAAGTTCGGA 


AGTGGAAAAT 


15540 


ATAGCGCGCC 


AACTGATGTA 


TACACCGGAT 


15600 


TTAGACGTTA 


ATAATAAAGA 


AAAGATAGAA 


15660 


GTGGCAATTA 


TGTGGATTAC 


CCACAG CGAT 


15720 


ATAACAATTG 


TTGATGGTCA 


AATTTCTAAT 


15780 
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CATTCCGATT ATCATTTCAT ATAAAGAAGG TTTACATATT ATTAAAGATT TAATTGTTGC 15900 

GACATTACGA GCAGTTGTGC AATTAATCAT TTTGGGATTT TTGCTGCATT ATATTTTTAA 15960 

AATAAACGAT AAATGGCTGC TTATTTTATG TGTATTGGTC ATTATTATTA ATGCATCATG 16020 

GAATACAATT AGTCGAGCAT CACCAGTGAT GCATCATGTG TTTTGGATAT CATTTCT AG C 16080 

TATCTTCATT GGAACGGCAT TACCGCTTGC AGGTACTATT GCGACAGGGG CCATTCAATT 1614 0 

TACCGCAAAT GAAGTTATAC CTATCGGCGG CATGCTTGCA AATAATGGCT TGATTGCAAT 16200 

TAATTTAGCT TACCAGAATT TAGATCGTGC ATTCGTACAA GATGGTACTA ATATTGAATC 16260 

TAAATTATCA CTTGCAGCTA CACCTAAATT GGCTTCTAAA GGTGCAATAC GTGAAAGTAT 16320 

TCGTTTAGCT ATAGTGCCAA CTATTGATTC GGTTAAAACA TATGGGCTTG TGTCGATTCC 16380 

TGGTATGATG ACAGGCTTAA TTATTGGTGG CGTACCACCT TTACAAGCGA TTAAATTTCA 16440 

ATTGTTAGTC GTGTTTATTC ATACAACTGC GACCATTATG TCTGCTTTGA TTGCGACATA 16500 

TTTAAGCTAT GGTCAATTTT TCAATGCAAG ACATCAATTA GTAGCACGAA ATACTGATGT 16560 

TAAGAGTGAA TCATGATAGA TTTTACTGCA TCAGATTTAG G CATTAGTTT TAATTGGAAA 16620 

TGAAGTGACG CGCACATATA GTATCGCTAT TCATTAGCGC AGCGAAAATA TTCATAAAGG 16680 

CACGCATACT TTGTAGTCAG TTATCTGTTC TGACATATAA AGCGTGCGTG CTTTTTTGGA 16740 

GTTATTGTTG AAACTGAAGT AATTATACAT AATTATTAAA TGACATACTT GTGTTAATTT 16800 

TTCAAATACT GAAAAACAAT TTCaATAATT TTCCaATTAA GCACAGAAAA TTAAAGCAAA 16860 

ATATTATATA ATAGAACGGT TATATATaAA nATTngTgCA CACATTTTTT AATAAATCGT 16920 

TATTCTAAGG GAAATGAATA TCGGAAATTT TGTTTGAAAG GAGTTTTAAA TTGTCAATCA 16980 

TGCGACTATT TACATTCATT TTAAGTATTT TTATCGTAGG AATGGTTGAA ATGATGGTTG 17040 

CAGGAATTAT GAACTTGATG AGTCAGGACT TACATGTATC AGAAGCTGTC GTTGGTCAAT 17100 

TAGTGACAAT GTACGCTTTA ACATTTGCGA TATGTGGACC TATTCTGGTT AAATTAACGA 17160 

ACCGTTTTTC ATCAAGGCCT GTATTATTAT GGACATTACT TATATTTATC ATTGGTAATG 17220 

GCATTATTGC TGTAGCGCCA AATTTTTCaA TATTAGTAGT TGGTAGAATT ATCTCATCTG 17280 

CAG CAG CAG C ACTAATTATC GTAAAAGTAT TAGCTATTAC AGCGATGTTA TCAGCACCTA 1734 0 

AAAATCGTGG TAAAATGATT GGACTTGTCT ATACAGGGTT TAGTGGTGCT AATGTTTTTG 17400 

GTGTACCAAT TGGAACGGTT ATCGGCGATT TAGTAGGTTG GCGCTATACA TTTCTATTCT 17460 

TAATTATTGT GAGTATTATT GTTGGCTTCT TGATGATGAT CTATTTACCG AAGGATCAGG 17520 

AAATACAACG AGGCCCTGTG AAT CATG AG A CACCATCTCA TGAAAATCAT GTTACTTCGA 17580 
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CAAACTCAGT GACATTCGTC TTTATAAATC CACTTATTTT ATCTAATGGT CATGATATGT 17700 

CATTCGTTTC ATTAGCACTT CTAGTAAATG GAATCGCTGG CGTTATTGGA ACATCATTAG 17760 

GTGGTATATT CTCCGATAAA ATTACAAGTA AGCOTTGGTT AATGATTTCT GTTTCTATTT 17820 

TTATCGTCAT GATGTTACTT ATGAATTTAA TCTTACCTGG TTCAGGTCTA TTGTTAGCAG 178 80 

GACTATTTAT TTGGAATATC ATGCAATGGA GTACTAATCC AGCAGTGCAA AGCGGTGTGA 17940 

TTCAACATGT TGAAGGCGAC ACAAGCCAAG TAATGAGTTG GAACATGTCT AGTTTAAACG 18000 

CTGGTATTGG TGTTGGAGGC ATTATTGGAG GCTTGGTCAT GACACATGTT TCTGTTCAAG 18060 

CTATCACATA TACGAGTGCC ATCATTGGCG CATTAGGATT AATCGTTGTT TTCACATTQA 18120 

AAAATAATCA TTATGCTAAA ACATTTAAAT CATCATAATT CTCATATGAm AAGCACGCCT 18180 

GCTATCAAAT TCAGGTGTGC TTTTTTAGAT GCGATAACGT TATTGATATG TGCGATAATA 18240 

20 GCGACGTTCA TTATGATACA TCGGCCAAGG CATTTTACCG CTTTTAGCAA AATTAGCTAA 18300 

ATCATTTTGC ATTTGTCGAC TTAAAAATTT AAGGTGaGCA GTTGTTGGaT ATgAT 18355 
(2) INFORMATION FOR SEQ ID NO: 68: 

25 ■ (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1192 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

30 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 68: 

CGCAAAGAAG TACAAAAAAT GTTTTTACAA GAAGGTATTA AAACACCTCA ACCAATTATG 6 0 

35 

ACTGCTTATA ATCATAGTGA AAACGgTGTT TAGTAGTTTA TAATACATGG AGG T CAT ATT 120 

TAATGGCGTC AAAATATGGA ATAAATGATA TAGTAGAAAT GAAAAAACAA CATGCGTGTG 18 0 

GAACAAACCG TTTTAAGATT ATTAGAATGG GTGCAGACAT AAGAATTAAA TGTGAAAATT 24 0 

40 

GTCAAAGAAG TATTATGATT CCACGTCAAA CGTTTGATAA AAAACTTAAA AAAATCATCG 3 00 

AATCTCATGA TGATACACAA AGATAGGAGA ATGATTAATG GCTTTAACAG CAGGTATCGT 36 0 

45 TGGATTGCCA AACGTTGGTA AATCAACATT ATTTAATGCA ATAACAAAAG CAGGTGCTTT 420 

AGCAGCGAAC TATCCATTCG CTACGATTGA TCCTAATGTA GGGATAGTAG AAGTGCCAGA 480 

TGCTAGATTA CTTAAATTAG AAGAAATGGT TCAACCTAAA AAGACATTGC CGACTACATT 54 0 

50 TGAATTTACA GATATCGCTG GTATTGTGAA AGGTGCTTCA AAGGGAGAAG GGTTAGGTAA 6 00 

TAAATTCTTA TCACATATTA GAGAAGTAGA TGCGATTTGT CAGGTCGTTC GTGCATTTGA 660 
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TAATATGGAA TTAGTACTAG CGGACTTAGA ATCTGTTGAG AAACGTTTOC CTAGAATTGA 780 

AAAATTAGCA CGTCAAAAAG ATAAGACTGC TGAAATGGAA GTACGTATTT TAACAACTAT 840 

TAAAGAAGCT TTAGAAAATG GTAAACCCGC TCGTAGTATT GACTTTAATG AAGAAGATCA 900 

AAAATGGGTG AATCAAGCGC AATTACTGAC TTCTAAAAAA ATGCTTTATA TCGCTAATGT 960 

TGGTGAAGAT GAAATTGGTG ATGATGATAA TGATAAAGTA AAAGCGATTC GTGAATATGC 1020 

AGCGCAAGAA GACTCTGAAG TGATTGTTAT TAGTGCAAAA ATTGAAGAAG AAATTGCTAC 1080 

ATTAGATGAT GAAGATAAAG AAATOTTCTT AGAAGaTTTA GGTATCGaAG AACCAGGATT 1140 

AGATCgrTTA ATTAGGAmCA CtTATGAATT ATTAGGnTTA TCCACCATAA TT 1192 
(2) INFORMATION FOR SSQ ID NO: 69: 



<i) SEQUENCE CHARACTERISTICS : 

<A> LENGTH: 7494 base pairs 
20 (B) TYPE: nucleic acid 

<C) STRANDEDNESS : double 
<D) TOPOLOGY: linear 



2S . (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 69: 

AATATAGCTG CAATAGCATC TCGTTTCATT TGTATAATCA ATTCCGGTTT AAATATCAGT 60 

GTGAACGTAA GCACGACACA GATTAAAAAT AACACTGCCG GAATGAGTOG TTTCAATCGT 120 

CGCTtCCAAA ACTCTAGCAA ATCGATTTTT TGCGTCCGAT AATACTCACT TATCAACAAA 180 

CTTGTTATTA AATAACCTGA AATAACGAAG AATGTATCTA CTCCTAAAAA GCCCCCACTT 24 0 

AACCATTGTG CATTCAAGTG ATAAATAATG ATTCCTATAA CTGCGAATGC CCTCAATCCA 300 

TCTAATCCAG GTAAGTATCG CGGGGAATAC ATTTTTTCTA AACGTTTAAA GTCTTTTGTA 360 

TCCAfGTTAA TAAACGCCCC ATTTATTTTT CTCTATTTTG TAGTATATCA CAATATTTTT 420 

GAAAATAAAA TATTGCACTG aTTTTCATTA ATTGATTTAA CCCTTAATTA AGATAGTTTT 4 80 

AAATTTTTTA TTAAGTAGAA AACAATTATT ACAGTTGATT TCATTACTGC AAACCACATA 540 

TAAATTTGTC GATTTTACTA CATAACATAG ATTATCATAG ATTCTTGAAT TTTTAGCAAA 600 

4S ATAACTGTTA TTTTCATTAT ATTTTTACAA AAAAAGGTTC G TTTT AT ATT TTATGCATCT 660 

TACTGTAACA GAATCATTAA GATATGCTAT TCGAATATAC TTTTTCAAAA TTTATATAAT 720 

GAATAAATTA ACATGTATTG AAAAAAAAGC GAAATGCAGC CTATCCTCTA ATGTAAACCA 780 

60 . AACGATATAT CTCGTCAGAC TTTATATTTA AACGCTATGT GTCACTTTTA AAATGAATAT 840 

TACTAAGATT GTCAT AT CAA TTATTATTGC ATCGAATTAA TCTTTTAAAT TTCTGTAATA 900 
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ACGGAAGTCA TTATTAGAAT AAAAATACTG TGCACTAATA AATTTATCAA TTGTTCCTAA 1020 

ATAAATACCA TCGATATTTT GTTCTTTACA TGTCATTATA ACTTTATCTA AAAGTTTTTT 1080 

5 ACCTATTTTT AAATTCCTAT AACCTTTATC AACAAACATT TTTTTAAOTO CAGACATATT 1140 

ATTATCTAGT CTAATCAAAC CTATAGTACC AACAATATTT TGaTGATTGT TTATTGCAAG 1200 

CCAAAATgCC CTCCATTATT CAAATAGTTA TGTT CGATGT TCTCCAAATC AGGTTGATCA 1260 

10 

TCTCTATCAA TTTTTATATa AATTCATTTT TTTGAATCGA TAAAATAAAC TCGATTAGCT 1320 

CTTCCTTATA AGACCTATTA TATTCAATTA TGTTTATAGC CATTTTTATC TCCTTTTTCA 1380 

15 TTTAATTTAA TTATAAAATG TGCGTTTAGT TTGTATCTAG TGTACTCAGT ACAGCCTCAA 1440 

ATGAAGTTTC ATTCCACTTG GCACTTAATA AAGACAAGTA TTTTAGCAGT AATACAATAA 1500 

AGTC CAATAA ATTTCCCTAA CTTCAATATC CACTTTTTAA AAAATGTATT TTTAATTAAT 1560 

20 AAAAAAACTC TCCCCAATTT CTATGGGAAG AGCTATATAT TTAATGTCTA AACATTACTT 1620 

TTATTTATTA TGAAGGAATT AGAATC CC CA AGCACCTAAA CCTTGTGCTT TGTATGCTTT 1680 

AACAGCTGCG TTGATTTGTT GGTCAACAGT GTTTGTTGGA CCCCAACCTG GCATAGTTTG 174 0 

25 GAATAAACCT GAAGCACCTG ATGGGTTGTA AGCATTTACT TGACCATTTG ATTCACGAGC 1800 

GATGATTGCA GCCCATGTAG AAGCTGAAAC ACCAGTACGT TGAGCCATGA TTTGAGCTGC 18 60 

TGATGAACCA GTAG CACCTG CAG T ATT A C C ATTGCTTAAT CTCACTGAAC TTGAAGTAGT 1920 

30 

TGAAGTGCTG TAGTTATGGT AAGTTGGAGC TGAAACAGCT TCAACGTtTG AGTTACTTGA 19 80 

TTGTGCATTG TAGCTTACTG ATTGTACATT TGAACCTTGG TTGTATGAAG TAGTGTAGTC 2 04 0 

TGCACCTGCA ACGTTTGAGA AACCAGCAGT TTGACCATTA GCTGCTT CAT AGCTCCATGA 2100 

35 

CCATGTAGTA CCATTTGAAG TGAAGTTATA TTGGAAACCA TCTTTTACAA AGTGGATGTC 2160 

ATATGCACCA TCTTTGATTG GAGCTGCATT TAATTGATCT TGGTGATTAT GCGCTAAGTC 2220 

AACTAAGTGT GCTTGATCAA CGTTTACTTC AGCAGCGTGT GCTTGATGTC CTGTACCTGC 2280 

40 

TGCGTAACCT GTTACACCTA ATGC CACTGC TAATGATGAT GCCATAATTG TCTTTTTCAT 2340 

AGTAAAAAAT CCTCCAGTAA TAATTGTnAG TTTATGTTTT TAGTAATTAT AtTTTGaATT 2400 

4S TGAATGTCGT AGTgCAAGTT TAAATTGTCT TTTATTTCTT TCaACGGTAC TCACTATATC 2460 

ACAaAAAACC AGCCAGTAAA TTACACTTTC TTTACAAAAC ATTACAATAT CAAGTGTTAT 2S2 0 

TTGtAATGTT GAAATATGGC TGTTTTATAC TGTAATGTGA AATATGTGCC CTTTAGAATC 2580 

50 CAATCAACCC TTGAAATAGT CTTTAACACA TAAGATTTTT ACTATATTTA GCTCAACTAT 2 64 0 

TACAGCTTTC GTAATATTAC AGATTGTATT TTTGTTACAT AGCTGTAATA TATCTGACAT 2 700 
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TACACATGTA TTGATTGCTA TTATTGTTGT ATATTCAAAG TTTTAAAACA CACATCTTTT 2820 

GTGAATTGTC TTATCTTTTA TTAGCGCAAA TAAACTGCAG CTCAATTATA TTGTTCAACT 2880 

TCATTCTCGC AATTCACAAT AACATTAAAT AATTTTTGGT CTCATATTTT CAAAAAACAT 2940 

ACTGTTATTA TCCCATGAAT TTAAAAATAT CATTAGTATA TAAACGAAAC ACTTTACGAT 3000 

AAATGATATC TGCAAGCCAA GCTGTTACAA ATGGTACAAC AAAGAACGCT ACTACAATTA 3060 

GTAAGACACT CAACCAAGCA GAATCAACCT CCATAAATTT AAATOCATTA ATCGGTCCTA 3120 

CCATTCCTAT AAAACCAAAT CCAGCTGACT CTTTCGTTCC ATGAATACCT ACTAATGCTG 3180 

ATACCAAACC TGATACAATG GCTGTCGTTA ATATTGGTAA CATAAGAATT GGATATTTCA 3240 

CCATATTAGG TATCATCATT TTAACGCCTC CAAAGAAGAC GGATAACGGC ACCCCTAAAC 33 00 

GATTCACTTT ACTTGTACCA ATTATCAATA CTGCTTCAGT CGCGGAGATA CCAATTGACG 3360 

20 CTGATCCAGC TGCTAAACCT GTAATACCTA TCGCAAAGGC AATGGCCACA GTTGATAGTG 3420 

GCGAAATAAT AATAAGACTA AATACCATTG AAATCAAAAT ACTCATGACA ATCGGTTGTA 34 80 

ATTCTGTAAA ACCATTAACC ATATTACCGA TGGCTGTTGT AATCATTTTC GTATACGGCA 3540 

25 ATATTAAAAC ACCAATTGCA CCTGAAATAC CGCCAACAAC TGTTGGGAAT ACAATCAATG 3600 

CCATACTACC TACGCGATGT TGAATAAGTA AAATGAATAA CACTGCAATC GCTGCTGTAA 3660 

TCATTGTATT AATTAAATCA CCAATACCCG TAATCATGCA. AGCACCATTT TTAAACTGCG 372 0 

CTGCACCGCT TCCTACATAT GCTGCACTTG CCACAACAGC AATTGCTAAT GGCGATAGGT 3780 

CAAATTTCAT GGCAACCAAT GCACCAATCA AAGCAGGTAC TGTAAATTGA ATTGCAACGA 384 0 

CAACGCCTAA TAACGTTTTA AAAATCGGAT GATAATCCAT AAAGTATTTA AAAATTTCTC 3900 

CAAGTATCGC ATTAGGAACT AAACCCGCAA CAATACCTAT GG GGACACGT GATAAAACTC 3960 

TAAATATAAA ATCTTTGGGT GTAATTGTTT TAATTGATGT CATAATATCA TCCTTCCATT 402 0 

TATGTATATA CAT CTGTATG CAAATAATAA AGAGCCTTAA GTTATAAGCT GCCACTAGCT 4080 

TAAATTCTAA GATGTG CATG CCGATGTTGT TATATTTAGG CTAGCAGTAT CATCTATAAC 414 0 

TCAAGACTAT GAAAAATAGT ATATCACAAA ATTCTGAATT TTTAGATAAA TAAATTGGCA 4200 

45 ATTTTTCAAA CATATTGTTA CAATACACTT TTATTTTATC TTCATTTTTA AAATCCATTA 42 60 

ATACAATAGA AGAAAGACAT TCAAATGCTT ACCAAAAAGG T A C ATT ATTT GTTAGGAGCG 43 20 

TATCAGCaCT TACATATCAT CAACACAATT GACAATATAA TAGAAGATAC TGATAATAAG 43 80 

SO TGTTAAAACA ACAGATGTTA GGTAGTGAAC AAATGATGGA AAGTAAATCC ATAGATCCAA 4440 

GAATCGTTAG AACCAAACAA TTGCTTGTCG ATGCTTTTCT TAAAATTTCT AGAGAAAAGA 4500 
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TTTACGCTCA TTTCGCTGAT AAAGAAGACC TCCTAGACTA CACATTATCT GTAACCATTT 


4620 




TAAAAGACTT 


GAATGATAAT 


TTGAGCATTT 


CTAATGTCAT 


TAATGAAAAG 


GTTCTGCGTA 


4680 


5 


ATATTTTCAT 


TTCAATTGCG 


AGTTATATCA 


AAGATGCTGC 


AAAGTCTTGC 


GAATTAAATA 


4740 




GTGAAGCATT 


TTGCAACAAA 


GCACATCAAC 


GTATTAATAA 


TGAATTAGAA 


GATATTTTTG 


4600 


10 


CGATTATGTT 


AGAAAACAGC 


TATCCGGAGC 


ATCAACGAGA 


TATCATTGTA 


AATAGTGCGA 


4860 


GTTTTTTAGC 


AGCTGGTATC 


TCAGGCTTAG 


CATTACATTG 


GTTTAACACG 


AGTCAAGAGA ( 


4920 




CAGCCGATGT 


GTTTATGGAT 


CGCAACCTTC 


CATTTTTAAT 


TCATCATATA 


GCACATTTTT 


4980 


15 


AATAAAACTT 


GGTATTTAGT 


CATGCATCTT 


GAAATCACTA 


TGTGACTTAG 


GTTCATACTT 


5040 




GTACACACAA 


TAAAATTTAA 


CGTATTACGA 


TTGATTAGCC 


GTGTCTAGGA 


CATAAATCAA 


5100 




CGTCCTATAC 


TCTACAATGT 


CATATTAGCA 


GTCGTTAACT 


GAATGAAAAT 


AAGCTTGTCA 


5160 


20 


TTAAAACATA 


TAGATTTTAG 


TGACAAGCAT 


TTTTGTTTTT 


GCGTACTTAA 


ACAACACTTC 


5220 




AGGCAATATG 


TTGTTTAGGC 


AACAAATGAT 


ATGTGCGTGT 


TTATTGGCAA 


ACGTACGACA 


5280 




TAGTAGTATA 


GTATGTCTAA ACAACATATG 


TTGCATAGTT 


GATATGCGTT 


GTTTAAATAC 


5340 


25 


TAAGATAGGA 


GGGATTGACG 


TGAGCGAGAC 


AGATGAACCT 


CAGGGGTTTG 


AACGCACGCA 


5400 




TAATATATTA 


AATATTAATC 


AGAGTAGTCT 


GGGTGTAGTG 


ACATACATTA 


CAAATAAATT 


5460 


30 


AAAGTGGACG 


TTGAAGCAAC 


ACATAATAAT 


TGCTCGTGGT 


AAAAAGCGAA 


TCGACTATCG 


5520 


ACTGTCGTAT AACTTTTACA TACGTATTAT 


GATAATGTAG 


AAATCAAGAA 


AATCGACTGT 


5580 




GAATATACCT 


ATGCTATGCC 


CATTG CAATT 


TTAATAAGAC 


ACACGATGTC 


ATTCGACAAT 


5640 


35 


GCTCATTTCT 


TTGCTCAGTT 


ACGTCATCCT 


GTCTTATAAA 


ACAACATTGC 


AGACATGTAT 


5700 


ATCAAACGAC 


ACTTCAATAA 


CATCACTTTG 


CCcATCGTAC 


TACTAGTAAA 


ATCGTGTCTC 


5760 




AAATCCCTTA 


TTTTAATTCC 


AAAAAtCTGC 


TGGTCAAAAG 


ACCGAGAAAC 


TAAAAACATT 


5820 


40 


ACTTAATGTG 


TTGATAAATT 


ACCATATAAA 


AATAATCTCA 


AAATATATCA 


ACACTTGATT 


5880 




CTAAGGAGGA 


TATGACAATA 


TGAAAATTTT 


AGATAGAATT 


AATGAACTTG 


CAAATAAAGA 


5940 




AAAAGTACAA 


CCACTTACTG 


TAGCTGAAAA 


ACAAGAACAA 


CATGCATTGC 


GTCAAGAcTA 


6000 


45 


CTTAAGcATG 


ATCCGAGGAC 


AAGTATTAAC 


AACATTTTCC 


ACAATAAAAG 


TGGTTGATCC 


6060 




AATCGGTcAG 


GATGTCACAC 


CAGATAAAGT 


TTATGATCTT 


CGCCAACAAT 


ACGGTTATAT 


6120 




TCaAAATTAA 


tATTTGCTCA 


CGAGGTATTG 


CACTTAAGGT 


GCCAACTGAC 


CTCATAAACA 


6160 


60 


AAGCCCATAC 


TGATTGAAGA 


CACTAATGTG 


tCsaCCATGG 


TGCACATTAC 


GCTTCATCTC 


6240 




TGTATGGGCT 


TTTTATTTAT 


TCTTTTGAGA 


ATTTCATTTT 


AGCAGACCAA 


AAAATTAAAA 


6300 
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TGAACGACTC TGCCACCCGC TTCTTTCACT TTATTCACCA ACTGGTCAAC TTCTTCATTT 6420 

GTGTTCACAC CTAGAGAAAT CATCACTTCA TTTGGTTCAG TATTAAGGCT TTGCTGACTT 6480 

5 

ACATTTTOAA AATGCTTGTn TTCTATTAAA ATTACGGkTG tTTGACCTAT tTGAATGCCG 6540 

ACCATTTTAT CTAACATTTG TGGGTTTCTA TTTATTTTAA ATCCTAACGC TTTATAAAAC 6600 

TGTGCGCTCT TTTCTAAATC TTGCACATGC AAATTAAACC ACATTGATTG AATCATGATT 6660 

10 

GCACCCCATT CATTACTTAT T ATAG TTTTG GACTTTAAGC CAATCACTTA ATGATAATCT 6720 

TGTTGGATTT ATTTCAGCCA TTAATTCAAA GTCTACTTCA TAACCTTTTT CTTCCAACCA 6780 

1$ TTGCTTTTCT GCAACACCAC TAACAAATTC TCCTTCTATA ACAGTAGATT TACCTGTCAC 6840 

TTCACTAAAA ATTGTTGCTG CTTCACTTAA TGTAACTTCA TCGGAACCAA TCTCTATTGA 6900 

TTGATGCGTA AAGCTTTGTG GATGTGCAAA AATATACGAT GCAATTTTAG CTATATCAAT 6960 

20 AGAAGAAATC ATTGTGAATT TTATATTCGG ATTAATAAAT TCTGGTAATG TAATACGTTC 7020 

ATCTTCGACT TTAGCAATGC GTAAAAAATT ATCCATAAAG AATGATGGTT TGATAACTGT 7080 

TGCATTTATA TTAGATTCCA TTAATCTATT TTCTATTTTT GCTAGTACTT CAAAGTGTGG 7140 

25 GCCAGTTCGA TTTCGATTAA CCCCTCCCGC AGTACTATAC ACAATATGTT GAATATTTTC 7200 

TTGCTCAGCT ATTTCAATTA TCTTCATACC TTGTCTTAAT TCTTCGCTAA CATCATCTTT 7260 

AACGATTGGC TGAATACTGT ATAAGCCATA CTTACCTTTC ATCGCTGATT GCAAACTAAC 7320 

30 

ATTATCACTC AG AT CACCTT CArCGATTGA TAAATGCGGA TGTCCTATGT CTGAAAGTTT 7380 

ACGATTATnC TTATTTCTAG TTAATGCACT TACATACCAT CCATCCTCTA ACAACTGTTT 7440 

TACAACTGCA TTACCTTGCT TCCCTGTTGC GCCTATTACn AAAATATCTT TCAT 74 94 

35 

(2> INFORMATION FOR SEQ ID NO: 70: 

r <i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 11802 base pairs 

(B) TYPE: nucleic acid 
40 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



45 <xi) SEQUENCE DESCRIPTION: SEQ ID NO: 70: 

AATTTATTTC GCCGTCCCAC CCCAACTTGC ATTGTCTGTA GAAATTGGGA ATCCAATTTC 60 

TCTTTGTTGG GGCCCcGCCC CAACTCGCAT TGCCTGTAGA ATTTCTTTTC GAAATTCTCT 120 

60 GTGTTGGGGC CCCTGACTAG AATTGAAAAA AGCTTATTAC AAGCGCATTT TCGTTCAGTC 180 

AATTACTGCC AATATAACTT CGTAGATCAT AGAACATTGA TTTATTTCCC AGCCTATTCT 240 
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AGCAAAGGTA ATAATGATAT TAATAATGTA 
TAAAACATCA GAACCACTAA AAACAAAAAA 
5 GACCACTTTT CAAAAAAATC TCtTTTCaTa 

TTATATTCTC TTTTAAGTTT ATTATTCAAA 
ATAAACATTT CAACTACTTT TAAAAACCAA 

10 

ATAAGTGAAC ATAGTTCTTT AGTTATAATA 
GCAATTGGTT TTCATTTCCT CTTAAAGATA 

1S CTATATTTTT CAACTTATCT CTATATTTAT 

CCTCTTCTTC GTGAGTTAAT AAATGAAGCA 
TTAAATTCGG TTTTAAAATA TGCAAATCAT 

20 CTCGTTTTAA TTCAATTTCC ACACGCCATA 

TATCTTTACG TTCTTGTTTT TATTATAAAT 
AAAATATTTT GTTTCTGGTT TTACATTACG 

25 

ATCTGACAAT GCATAATAGT CATTTAAATC 
CGTAAAACTA ACATCGTCCA AATAACTGAT 
ATGCGAAAGC TTATTAGGAT TAAATTCAAC 

30 

TTTATTTTGT CAT ATT CAAT ATAAACTTTT 
TGTAAAATAT CCCAAAGCCG AATTTCAGGA 
35 GCGTTAGACA TGCTAAGATT CCCAACAATC 

GCTAGTGACA TCCTATGTCG ATTTAACCGG 
ACAAATGGAT GAAACGAAAT TCAAAACACT 

40 

TACCATTATG TTCCTACTAA AAAACyAAAA 
TAGGATACTA TGTAATAAAA ATTTACAATA 
GmATACCCAT ACAAAGAGGA TAAAATAAAA 

45 

CTCGAGGTTT AAATATTGGT GCCTTATTTA 
TCATTAACmT AATCCTTAAA GAGTTTTAAA 
50 TCATCAACTT TTAAATAATT CAATAATTTT 

AACTTTAATA AACTATTCAT TTTGACAGGA 
AATACTTTCT CGCTTTAnAC AAAnACAAAA 

55 



CAAAAAATAT AAATCAAATC GACATCCTTA 360 

GCACAAAATA AAATTAAATT TAAAATAAAC 420 

TTTCCACCCC TAATTTTAAT AAGCATTATT 480 

AGGAAAACAG AAATATCTTT CaATATTATT 540 

CAAAAAAATA CTTATTTTAA GTAGATGAGC 600 

ATTAATTCAA CCAAAAGTCG ATTTGTTTTT 660 

TTTTCATTAA ATCTGTCAAA TCAATAGACG 720 

TTTTAGTACG TCTTTCTAAA TTTCCCCATT 780 

TTGCTCGTTC TTGTATATTT TCAATCATTT 840 

CAAAACAATC TTTCCAACAA TCAACCATAT 900 

GAAATGTTGA ATCAATTTCA ACATCTGCAT 960 

CCGAATAAAC CTATCACTAT TACGCACACC 1020 

TCCATAAAAT ATAGTTTTCT TTACCGACTT 1080 

AAATTCAAAA TCAAAAGCCA AATCTAATCT 114 0 

GATATTTTGT TTTAACCAAA GCACTTCATC 1200 

GCGCATAtAC GTCTATTCCA AAGAGTTGCT 1260 

TCTTTAAGAG CTTTAGCTTT AAAGTTTGTT 1320 

TTAGTACTCA TAAAATGTGA AAGTCTCTCT 1380 

GTTATAGCGT CAAAAGACAA TTTTGGAATA 1440 

CTATTACCGG ATATTAGAGT ATCCAGTTTT 1500 

AAAAAATATG TTCCACTAAC AGCAAAAAAA 1560 

ATACTGGAGA ACAAATGTCA GGATATAACT 1620 

AAAAAACAGG AAAACAAATT TCAAGTAAAA 1680 

AACCTCGAAC TGaAATGATG ATCTTTTCAG 174 0 

TATAGATTCG TTATATTATA TTCTCTATTT 1800 

TTAATACCTG CTAGATGATT CAAAAATGTT 1860 

TGTGGTGTCA GTAAATnTCT ATCAAAATAC 1920 

CGTGACATTT CAATCACGTC GTCTAAAGAT 1980 

ACTTACCCGA TTAAAATCAA GTAAGTTTTA 204 0 
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TATTTGATAA AAAATCAATA AGTAATTGTG 


CGCCTTCAAC 


TTGAATATCT 


TTTACAACTG 


2160 




GCGCGTCGAT 


ATACATATCA 


TACTGACCAC 


CGCCTACTGC 


ACGATAATTA 


TTTACACAAA 


2220 


5 


TTGTATATGT 


CTGCTTTAAA 


TCAACTGCGT 


GACCTTGAAT 


CATCATATTG 


CTCACACGTT 


2280 




GTCCCTTTGG 


TCTTCCAACA 


TGAATGGTAT 


AACTTACGCC 


ACCATATATA 


TCATAATTAA 


2340 


10 


AGTGTTGTGG 


TTTGGGTTCA 


AGGAAGTCTG 


CGCTCACACT 


AACTTCATCA 


TTTTTCACGT 


2400 




CAAAATATTC 


TGCTGATCGT 


TCAATGGCTT 


CTTTAAGTTT 


GGCACCACTT 


ACAGCTAAAA 


2460 




CTTTAAATGT 


ATTTGGAAAT 


GGGTAATTGT 


TAATAACATC 


TCGCATCGTC 


ACGACTTGCT 


2520 


75 


TGAAACCACT 


AGCAGAATCA 


AACAAAGCTG 


TACAGGCAAC 


ATCTGCGTCA 


CTTTTTTCTA 


2580 




ATAAAGCGTA 


ATTCATAAAA 


A A a W X 


GATGCGGTGC 


CACACGTGCC 


TCAAATGCAT 


2640 




GATTAATOGT 


CATATCATAT 




TAATTTCGTA 


ATCTAACCAG 


TCCTCTAACT 


2700 


20 


GCTTTCGTAA 


ATGTTGGTCA 


X W J. l\~r\l\~tv\ 


TAGTAAATGT 


GGAATCATCT 


ATAACAGGAA 


2760 




GTAATTCACA 


TGATTCAACX3 


vjLrllAVx/il 111 


CATATTCATC 


AGTACTCAAG 


ACTACTCTGC 


2820 


es 


CTACAGTTGT ACCTCTCGTA 


LLnuu 1 1 VjJaM 


TCACAGCCGT 


TTGCTTAAAC 


CTTTCAGCAA 


2880 


TTTGTCGATG 


TTGGTGACCC 




TATCTATATC 


TTTAGAAAAC 


GCTTCTAACA 


2940 




TGGCATATCC 


TTCATTTTCA 


uU^.ul innl/i 


CTTCGGTCGG 


CGTACGACTT" 


TCTAAATCCT 


3000 


30 


TTTCAAATCC 


ACCATGGTAA 


CAAACCACAA 


TGATATCTGC 


ATGTCGCTTC 


ATTTCAGGTA 


3060 




AGTATTGTTG 


AAGTATTTCA 


AAAGCACTAT 


GAAACGTArT 


GnCnTGAATA 


TGCTCTGGTT 


3120 




GTTCCCAATG 


GGGAATAAAT 


TGTGTCGTTA 


AACCTATCAC 


AGCAACAGTT 


TGATCTCCAA 


3180 


35 


CCTGAAAATA 


CTTCACACCG 


TTATCAGTCA 


ATGTACTATC 


ATTTTCATAT 


ATATTAGCGC 


3240 




ACAAAACTGG 


ATAATTGAGT 


CTG CGTAAAG 


TGTCTTTTAA 


GTATGGTAAT 


CCATAATTAA 


3300 


40 


ATTCATGATT ACCAAGCGTA CCAAAGTCGA ATGCCATTCG ATTATAAAAA TCAACTAAAG 


3360 


GCTGGCTACT 


GCCGCTATGC 


GCGATTAAGT 


AATTACAAAA 


TGGTGACCCT 


TGCAAAAAAT 


3420 




CACCATTATC 


TATTTTAAAA 


CTTTGGTCAT 


ACTGCCTTCT 


GTsTTGTTCT 


ATAACATGAT 


3480 


45 


TCGCTAGTAA 


CAATCCCATA 


GGTTGATATT 


GATTTCTACT 


CGTAAAATCT 


GTTGGGAAAA 


3540 




TATAACCATG 


TACGTCACTC 


ACGACATAAA 


ATGCTATGTT 


TGACATCCTC 


ACTCACTCCT 


3600 




TCAATCACAA 


ACATCTTTCT 


TATTTCTATT 


ATATATTTAT 


TTGAAGTCTG 


TTGTAATCAA 


3660 


50 


GGTTTTGTCA 


CCGAGTTTTA 


AACGAATCTT 


TGAACCTTCC 


ATACTTTCAA 


GTACTTTAGC 


3720 




ATTGACCTTA 


ATTGTGACAT 


TTCCGTTTTC 


ATCTGCTTTA 


ACTGTTGGCA 


AAGTACTGTA 


3780 




ACCTGGTGGG 


TTATAATCGT 


TATCTTTACT 


TGAAAATTGT 


CCGATTTGAC 


GTCCGCCTTC 


3840 
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TATTGTCATT TCAAATGGCT CATTTACAGA AACATTTTGC GGGATATCAA ATGTTACTTT 3 960 

TTCGTTCTGA TTTGGTGGTG TATGATCATC TGGTQTGTTT GGCTGAGGAT CTGCGCCTTT 4020 

5 

TTCGCTGCCA TAACTACCTG CTTTAAATGT TGTTGGATCA TACCATTTAT AACCACTCGG 4080 

CGGTTGTGAC CATGGCTCTT TTTCAGGCTC AGTTGAACGC TCTGGTCGTT CAAAATCAAG 4140 

CAACTTAGTC TTTGTATCTA ATGTTAGGCT ACTCGCCTTA AGTGATTTCC CATCATTATC 4200 

10 

TTTAGACATC CAAGCCGTTA TATTATTTAA TAGCTTACCG TTGTCTTGTT CTTTAAAACC 4260 

ATCATATGTT TTCTTCTTTT CTCCATTATC TTCTCTTACA TATTTGGGCG AACTATCTTC 4 320 

15 CACAAGTGAT GAATCACCGA TAAATGCTGC TTTACCTTTT CCAACTTTAG AAATTGCTAC 4380 

ATAGGGGCCT TCTGCTTTAC CGCCCCCATT ATAAATACCT TGATCTACAG CATGTGACCA 4440 

TTTACTTTTC GCTGGCAATT GTTCTGGTGT ATACACAATA CCTTTTGCTT TCTCTGGATT 4500 

20 

AGTAATTGCT AATGTCGATC CGGCATGCAT AGAGACAGAT TTCACACCTT CAGTAATACC 4560 

GAAACTTTCT TTTGAAGAAA CAATATTGCT CGTATTTAAA TCACCTAGTG CATT AT AT CG 4620 

AAAACGTACG CCAAAGTTTG TAGATAACCA ATCTGAACTT TTCACACCTT GCATTOCAGT 4680 

25 

AGAACTTTTT TCTTCTGCAT TCATACCTTT CGACATATCT TCATATGCTC CACGTCGATA 474 0 

ACCATTCATT GCCTCCGATG AATCAATACG ATTTAAATTT CGGTCAGCAT TGTAATGATC 4800 

30 TGAAATAAAG ACAACATTGC CACCTTGTTt CACATATTTA ACAATTGCTG CCTGTTCTGA 4 860 

TTCTTTGAAA GGAATGTTAG CCTCAGGAAT TACAAATATT TTGGAACTTT TCAAACTTGC 4 920 

TTCTGTTATG TTCGAATGAC CATCAATAGC TTTAACGTCA TAACCTTGTT TTTGTATTGA 4 980 

35 ATCCGCATAA TCTGAAAATG CACCATCACT AACCCAATCT GCAGCACCAG CTGTTTGACC 5040 

ATGAGAACGA TCGAATAATA CCGTTCGCTG TTGCTTTGTA GGTTGCGATT CATGCGTTAT 5100 

AGCTAAAGAT TGCGGTAAAG CACTTAATGA TACCGTTGCA ACAATTGCAG AGACAGTTAA 5160 

40 

TGACTTATAT ATTTTTTTCA TTTTGTGAGG CTCCTTTTAA AATAAATTTG TTCTTGAATT 5220 

ATAGGATAAA AATTCGTTGC ATATGAGCAA TTTAACGAAA AATTTACAAA ATCTTATCAA 5280 

ACTCTTAAAG AAAGTTATTA AAATTCATTT TTATAAAATA CTTTTTAACA TTTAAATGTG 5340 

45 

GTACG CTATA AGTGTAATTT CATTGCATAC ATATTACACG ATTAAGAATG TGAAGGGGAC 54 00 

AGTTATCAAA TGAAAAATTT TAAGTGTTTA TTTGTATTAA TGTTAGCAGT CATTGTTTTT 54 60 

SO GCAGCAGCAT GTGGAAACTC AAGTTCTTTA GATAATCAAA AGAACGCTAG TAATGATTCG 552 0 

GATTCTAAAT CAGGAGGATA CAAACCTAAA GAATTAACCG TTCAATTTGT ACCTTCGCAA 5580 

AATGCTGGAA CATTAGAAGC TAAAGCAAAA CCATTAGAAA AATTACTATC TAAAGAATTA 564 0 
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TCTAAAAAAG TTGATGTTGG TTTCTTACCA CCAACGGCAT ACACATTAGC ACATGATCAA 5760 

AAAGCAGCTG ATTTATTATT ACAAGCACAA CGTTTCGGTG TAAAAGAAGA TGGTTCAGCA 5820 

5 

AGTAAAGAAC TTGTAGATAG TTATAAATCA GAAATTCTTG TTAAAAAAGA CTCAAAAATT 5880 

AAAAGCTTGA AAGATTTAAA AGGTAAGAAA ATTGCCTTAC AAGATGTAAC ATCAACTGCT 5940 

GGATATACAT TCCCACTTGC GATGTTAAAA AACGAAGCAG GTATTAATGC AACTAAAGAT 6000 

10 

ATGAAAATTG TGAATGTTAA AGGTCATGAC CAAGCAGTTA TCTCATTATT AAATGGAGAt 6060 

GTAGATGCTG CGGCTGTATT TAACGATGCA CGTAATACTG TGAAAAAAGA CCAACCAAAT 6120 

15 GTATTTAAAG ACACACGAAT TTTAAAA1TA ACACAAGCTA TTCCGAATGA CACAATTTCT 6180 

GTAAGACCAG ATATGGATAA AGATTTTCAA GAAAAATTGA AAAAAGCTTT TATAGACATT 6240 

GCTAAATCAA AAGAAGGTCA CAAAATTATT AGCGAAGTTT ATTCACATGA AGGATACACA 63 00 

20 

GAAACGAAAG ATTCAAATTT CGACATTGTA AGAGAGTACG AAAAATTAGT TAAAGATATG 6360 

AAATAATCAT TATTTAACAA ATGAATCATT AGCGAATTTG GTATTAAAAG CTTTCGTTCA 6420 

ATAGATATAT TCTAGATTAA TATTGAAAAG CTAGGCGCTA AACTGAAACA GATATAGAAA 6480 

25 

GGTGTCGCTG TACATTTGAA ACCATTTGTA CACAGAAACC CAATGTCTAT GATATTTCAG 6540 

TTTACCTTGG CTTTTCTTTA TTAAAGAAAG GTGTCAAACA TGAGTCAAAT CGAATTTAAA 6600 

3Q AACGTCAGTA AAGTCTATCC TAACGGTCAT GTAGGCTTGA AAAATATTAA CTTAAATATT 6660 

GAAAAAGGTG AATTTGCAGT TATTGTCX5GA CTATCTGGTG CTGGGAAATC CACGTTATTA 6720 

AGATCTGTAA ATCGTTTGCA TGATATCACG TCAGGTGAAA TTTTCATCCA AGGTAAATCA 6780 

3S ATCACTAAAG CCCATGGTAA AGCATTATTA GAAATGCGCC GAAATATAGG TATGATTTTC 6840 

CAACATTTTA ATTTAGTTAA ACGGTCAAGT GTATTACGAA ATGTACTAAG TGGACGTGTA 6900 

GGTTATCACC CTACTTGGAA AATGGTATTA GGTTTATTCC CAAAAGAAGA CAAAATTAAG 6960 

40 

GCAATGGATG CACTAGAACG CGTCAATATC TTAGATAAAT ATAATCAACG CTCTGATGAA 7020 

TTATCAGGTG GCCAACAACA ACGTATATCT ATTG CACGTG CGCTATGCCA AGAATCTGAA 7080 

ATTATTCTTG CAGATGAACC AGTTGCTTCA TTAGACCCAT TAACTACGAA ACAGGTTATG 714 0 

45 

GATGATTTAA GAAAAATCAA CCAAGAATTA GGCATCACAA TTTTAATTAA TTTACATTTT 7200 

GTTGACTTGG CAAAAGAATA TGGCACACGC ATCATTGGTT TACGTGATGG TGAAGTTGTC 7260 

so TATGATGGTC CTGCATCTGA AGCAACAGAT GACGTATTTA GTGAAATATA TGGACGTACA 7320 

ATTAAAGAAG ATGAAAAGCT AGGAGTGAAC TAACATGCCT TTAGAAATAC CTACAAAGTA 7380 

TGACTCCCTT TTAAAGAAAA AGGTTTCTTT AAAAACGAGT TTTACCTTCA TGTTAATCAT 744 0 

55 
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AATACCTCAA ATAGGTOATC TATTCAAACA 
ACAAATTACA ACGCCAATGT TAGATACCAT 
5 TAGCATCGTT TCAATACCAA TTGCGTTATT 

GATTTCAATA CCCTCGCGCT TTATTTTAAA 
AGCAGCAATC TTTGTGGCTG TATTTGGAAT 

10 

TATTTTAACT ATCTGTATTA TTGGAAAATT 
AGGTCCAATG GAAGCAATGA CGGCTGTTGG 

1$ TGTTGTACCA CAAGCCATAT CGTCATTTAT 

TATACGTGCT TCAGCTGTGC TTGGATTAGT 
TCAAACACTT GGTTTATTTC AATATCCAAA 

20 TATCGTCGTC GTCATTGATT ACATCAGTAC 

GAAATAGCAA AATATAATGT TCACACAAAA 
CTTATTGCAA TTGTCGTCTT AGCTATTATC 

25 GAACTTAAAA GTAAATCATT AGAAATCTTA 

GATATCAGCT ATATCTATAT ACCAGATGGC 
TTTGCGATAG CCGTTGTAGG TACTTTCATC 

30 

CTAGGTGCAA ATAATATGGT AAAGCTACGC 
AGTGTTATAC GTGTCTTCCC AGAAATTGTA 

3$ CCAGGTTCAT TTTCAGGTGT ATTAGCTTTA 

TTTTAGCTGA AGATATTGAA GGTCTAGATT 
GTGCEAATAA GATTAAAACA CTCGTATTTG 

40 TAT<jACTCAT ACTTTATCGC TTTGAACTAA 

TTGGGGCTGG TGGTATCGGG ACACCACTCA 

GTGTAGGTAT TATATTAATC GGTTTAGTAC 

45 

GTTCAATCCG AAAACGTATT GTTTAACATT 

ACCGTCTTAC GTTTCTCTAT TATAATAAAA 

AACTTCACTG CTGTTTTTAT AATATCTAAA 

50 

TTTACCGAAC TCTGGTAATG TTACGTTGAA 
GAATGTAGTA TCACTTTCTA GTGCATGACC 

55 



AATGATTCCA CCTGATTTCG AGTATTTACA 75 €0 

TCGAATGGcT ATCGTAAGTA CAGTATTAGG 7620 

ATGTGCTAGC AATATCGTTC ATCAAAAGTG 7680 

TATAGTTCGT ACTATTCCAG ATTTG TT ATT 7740 

CGGTCAAATT CCAGGGATAT TAGCACTGTT 7800 

ATTATATGAA TCATTGGAAA CGATAGATCC 7860 

CGCTAATAAA ATAAAATGGA TTGTTTTCGG 7920 

GTCATACGTA TTATATGCAT TTGAAGTAAA 7980 

CGGCGCTGGC GGTATTGGAT TGTTTTATGA 8040 

AACAGCAACG ATTATTTTAT TTACTTTAGT 8100 

GAAAGTGAGG GCACATCTCG CATGACACAG 8160 

GCACACAAAC GAAAATTGAT TAAAAGATGG 8220 

ATCTGGGCAT TTGCAGGTGT ACCAAGTTTA 8280 

AAATCCATAT TCAGCGGATT ATTCCATCCT 8340 

GAAGACTTAT TACGTGGTTT ACTTGAAACC 84 00 

GCCGCAATTA TCTGTATTCC ATTAGCATTT 8460 

CCAGTTTCAG GTGTTAGCAA ATTTATTTTA 8520 

ATGGCACTTA TATTTATCAA AGCTGTTGGC 8580 

GGTATCCATT CCGTAGtATG CTTGGGAAAC 8640 

TCAGTGCTGT AGAATCATTA AAGGCCAGTG 8700 

CAGTCATACC ACAAATTATG CCTGCCTTTC 8760 

ACTTACGTTC AGCTTCTATA CTGGGGCTAA 8820 

TATTTGCCAT TCAAACACGT TCTTGGGACC 8 8 80 

TAATGGTCGC AATTGTCGAT TTAATTTCCG 8940 

AAATCAGGAT ACTCCTAAAT AAGAAGTCCT 9000 

ACAGCAGTGA AGAAAACTAT TGTTATAGTT 9060 

TTTATTCTAT TTCAATTCCT TTAAATAACT 9120 

ATTATCTGCT ATAGTTGCAC CGATAGAACT 9180 

ACCTTTAAAT TTCGGACTGT ACATAATTAC 9240 
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TGTAATAATT ACTAAATCGT CTTCTTTTAA 
GAAATCTTTA ATTGCTTGTG CATAACCTGG 
5 AAAGTCTACT AAGTTTAAGA AGCTAATACC 

TTGATCCATA CCGTCCATGT TACTCTTCGT 
ATAAATGTCA TTAATTTTAC CGATCGCAAT 

10 

TAAGACAGTT TTACCAAAAG GTTTTAACGC 
GTTTCCTGGT TCACCAACAT ATGGACGTGC 

r5 TTTTGTCAAC TCACGAACCT TTTCACAAAT 

TTCATGTGCA GCAATTTGCA ATACTGGGTC 
TTTCATTTGG TGCTCGCCCC ACTCATOGAT 

20 AACAACTTTA CGACCTGTCA TTTCTTCAAT 

AGGGTATACT TTAAAAGGTT G CATAAT ATT 

TGTATCTTTA CCAACTGAAG CTTCACTCAA 

25 

TGCATTTACT ACTGGTAATT TATCGATGTT 

AGTTTG AT CG AAACCTTCTA AGGTATGTCT 

AGCTGCGTCT GGCGCTTCAC CAATACCTAC 

30 

AAATGGTCTT GTCATAGCTA TCACTCCCAA 
TTCTAAACCT TG CAT AATTT GAACACCTGC 

35 AACCATTTTA TTGAAATCTT CTAAATTACG 

AGCACCTACT GTATCTTTCA TTAATTTAAC 
ACCTGTTGAA GTTTTAACGA AGTCCGCACC 

40 AATTTCGTCA TGGTCCAACA ATACCGTCTC 

AGCTTTAACC ACTGCTTCAA TGTCTTGTTG 
GCCGATGTTG ATGACCATGT CAATTTCATC 

46 

AAATGCTTTC GTTGCAGTTG TCGACGCACC 
CACCTCTGAA TCAGCTAGTC GCTCTGCTGC 
AGATTTAAAA TTGTATGctT TCGCTTCATC 

60 

CTCAGGCTTC AATAAAGTGT GATCTATATA 
TGTTATATAA TCTCTTTATT TAATTTTACT 

55 



GTTGCTAAAC AGTTCTGGCA AGCGATCATC 9360 

TTTATCACGA CGATGACCGT ATAATGCATC 9420 

TGTGaAATCT TTCTTAACAA TTTTCATCAA 9480 

ACGAACCGCT TCTGTTACAC CTTCACCATC 9540 

AACATCATAA CCACCGTCTT TCAAATGATC 9600 

ATAGTCATGT CGATTAGATG TACGTGTAAA 9660 

GATAATACGA CCAATTAAAT ATTTAGGGTC 9720 

ATCATATAAC TCTTCTAATG GGATAATGTC 9780 

TGCACTTGTA TAAACAATTA AGTCACCAGT 984 0 

AATTTGCGTA CCCGATGCCG GTTTGTTAGC 9900 

TTGTTGAATT AACTCTTCAG GGAATCCATT 9960 

TAATCCCATA ATTTCCCAGT GACCAGTCAT 10020 

TTTAGTATAG TATGCTTCTG GTTGTTCAAC 10080 

CCCTAGACCT AACTTTTCAA GGTTTGGTAA 10140 

TAAAGTATGT GAACCTTCAT CTTTAAAATC 10200 

TGAATCCATT ACGATTAAAT GTACACGATT 10260 

AATTTATATA TATTAGTAAT CTGAATCTGC 10320 

GCTCGCACCA ATACGTGTCG CACCTGCTTC 10380 

TACGCCACCT GATGCTTTTA CTTCTACATC 10440 

GTCTTCTG CA GTCGCACCGC CACCTGCAAA 10500 

AGCCGCTTTT GTTAATTCAC TCGCTTTTAC 10560 

AATAATCACT TTTACTGTGT GACCTTTCGC 10620 

TACATCATCA AAACGTCCAT CTTTTAATGC 10680 

TGCACCATTT TGAATTGCAT CTTCTGTTTC 1074 0 

TAATGGGAAT CCTATTACCG TACAAACGAG 10800 

ATATTTAACA TGTGTTGGAT TCACACATAC 10860 

GATGATTTGA TCGATTTGCG TACGTGTTGA 10920 

TTTCTCAAAT TTCATACTTA CTACTCCTCG 10980 

ATAAATACGA ATATATCTCG CGAATTTATA 11040 
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ATACTCATTA AACCTAAAAT AATTAAAATA ATACCGAAAT GTQAACTTAA TGCATCATTG 1X160 
CCTGGGAAAT TTAATGCTTT AAAATCGATT AGAGCCGCAG CAATCGCAAT ACCTACAGAT 11220 

5 

ACCGCCACAT TAATAATTAA ATTATAAAAA CCAATAGCCA CACCTGTCAT ATTAAGATCT 11280 
ATTGTTTTAA TGGCTTCGTT AAGTAAAGGT GCATACATTA AAGCAAAGCT ACCTGCAAAG 11340 
AATATCATAG AAATGACGAA GATTGAAATG TGATTACCTA CTGCAAATGC AGGTAAAATC 11400 

10 

AAGCTCAGTG CTATTAAAAT AATTGCTGTG ATAATCG CTT GTTTTGAATT CAGATATTCG 114 60 
CCGATTTTAC CACTTAGTGC ACCAACAATG ACTGCTACTA TATAACCCGG TACTAATAAC 11520 

is AGTGATGTTG TGTCTAGTTG CAGATGATAA ATTTGCTCCA TTATGAATGG GAACGTAAAA 11580 

ATATAACCCA ATTGGATAGC ATACATTACA AATACTATAA ATAAAAATGA AGCATAACGT 11640 
TTATTTTGGA AAAATGATTT ATTTACTAAT GGACGTTGCG CATTTTTAAT ATATAGCGCA 11700 

20 AAAACGATAA TCGCAATTAA GGCACCAATC ATATATAACC AATTAAAGTT CGTAATAAAC 11760 

AGCATGACTG TTGTAGCAGG GGATCCTCTA GAGTCGAnCC TG 11802 
(2) INFORMATION FOR SEQ ID NO: 71: 

25 

- (i) SEQUENCE CHARACTERISTICS: 

<A) LENGTH: 1196 base pairs 

(B) TYPE: nucleic acid 
„.- (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

30 



<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 71: 



35 



40 



50 



CTAAAGAAGA 


TGCGAAACAA 


GATGTTGATA 


AACAAGTTCA 


AGCTTTAATT 


GACGAAATCG 


60 


ATCAAAATCC 


AAATCTAACA 


GATAAGGAAA 


AACAAGCACT 


TAAAGATCGT 


ATTAATCAAA 


120 


TAC7TCAACA 


AGGTCATAAC 


GACATTAACA 


ATGCGATGAC 


AAAAGAAGCA 


ATTGAACAAG 


180 


CAAAAGAACG 


TTTAGCGCAA 


gCATTGCAAG 


ACATCAAAGA 


TTTAGTGAAA 


GCTAAAGAAG 


240 


ATGCGAAAAA 


TGATATTGAT 


AAACGTGTAC 


AAGCTTTAAT 


TGACGAAATC 


GATCAAAATC 


300 


CAAATCTAAC 


AGATAAGGAA 


AAACAAGCAC 


TTAAAGATCG 


AATTAATCAA 


ATACTTCAAC 


360 


AAGGT CAT AA 


CGACATTAAC 


AATGCGCTGA 


CTAAAGAAGA 


AATTGAGCAG 


GCAAAAGCAC 


420 


AACTTGCACA 


AGCATTGCAA 


GACATCAAAG 


ATTTAGTGAA 


AGCTAAAGAA 


GATGCGAAAA 


480 


ATGCAATAAA 


AGCCTTAGCT 


AATGCGAAgc 


GTGATCAAAT 


CAATTCAAAT 


CCAGATTTAA 


540 


CACCTGAGCA 


AAAAGCAAAA 


GCGCTCAAAG 


AAATTGACGA 


AGCTGAAAAA 


CGAGCACTAC 


600 


AAAACGTTGA 


GAATGCTCAA 


ACTATAGATC 


AATTAAATCG 


AGGATTAAAC 


TTAGGTTTAG 


660 
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TTGAAGCAAC ACCTGAGCAA ATCCTAGTTA ATGGTGAACT CATTGTACAT CGTGATGACA 780 

TCATTACAGA ACAAGATATT CTTGCACACA TAAACTTAAT TGATCAGCTT TCAGCAGAAG 840 

TCATCGATAC ACCATCAACT GCAACGATTT CTGATAGCTT AACAGCAAAA GTTGAAGTTA 900 

CATTGCTTGA TGGATCAAAA GTGATTGTTA ATGTTCCTGT AAAAGTTGTA GAAAAAGAAT 960 

TGTCAGTAGT CAAACAACAG GCAATTGAaT CAATCGAAAA TGCGGCACAA CAAAAGATTA 1020 

10 

ATGAAATCAA TAATAGTGTG ACATTAACAC TGGAACAAAA AGAAGCTGCA ATTGCGnAAG 1080 

TTAATAAGCT TAAACAACAA GCAATTGGAT CATGTTnAAC AATGGCACCT GGATGTTCCA 1140 

T5 TTCAGTTGAA GGAAATTTCA ACAACAAGGA ACAAGCGCCn GATTGGAACA ATTTGA 1196 

(2) INFORMATION FOR SEQ ID NO: 72: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1519 base pairs 
so (B) TYPE: nucleic acid 

<C) STRAND EDNE S S : double 
(D) TOPOLOGY: linear 



■ <xi) SEQUENCE DESCRIPTION: SEQ ID NO: 72: 



30 



3S 



50 



CAATCGTTTC 


AACGCTATTA 


TCTTTAGACA 


ACAATTGTAA 


GCGTGTATGT 


GCAGTTT CTA 


60 


AACAGTCTAT 


AATTCGAGTT 


CTTAATTCAG 


CTGGATCATC 


TTTAAAAATA 


AAATCCATCG 


120 


CTGCAACTTT 


GTAGACAAAT 


GTTAAATAGG 


TAAGTTCACT 


GTGACTCGTA 


ACGAAAATAA 


180 


TGTTACCAAC 


TGGGTCATGC 


TTACGAATTT 


CACTGCCTAA 


TTTGATACCA 


TTAATATCAG 


240 


TTGAAAGTTG 


AATATCTAAA 


AAGTAACAGC 


CTATGTCATT 


CATATTTTTA 


GCTTGCTCAA 


300 


GCACCTCATA 


AGGATTATCA 


GTTGCGAGGG 


CAATTTCCAT 


AGGCTTTTCT 


TCTATCATTA 


360 


TATAATTTTT 


AATAATGGTA 


ACCATGTTTT 


CTCTTTGTTT 


TGGATCGTCT 


TCGCAAATGA 


420 


AAATTTTCAT 


ACATTCACAT 


CCTTATGGCT 


AGTTGTTAAT 


AATTTCAACT 


TTTTGAATAA 


480 


AGAAACCATT 


TTCGATAATT 


GTATCTAATA 


AGACATTGTC 


TGCATTATCA 


GCAATTTCTT 


540 


TTAAAGTTGA 


TAGACCTAAA 


CCACGACCTT 


CACCTTTAGT 


AGAAAAACTT 


TCTTGGAACA 


600 


ATTCATGAAT 


GCGTGGTATA 


TCATCAGCGC 


ATTTATTCAT 


AACAATAAAC 


GTTACTGAAT 


660 


TTTCACTTTC 


AATAAATGCA 


ACGCGAATGA 


TAGGGTCATC 


AATTTCAGTT 


GATGCCTCAA 


720 


TTGCATTATC 


AAGAATAATA 


CCAATACTGC 


GACTTAAATC 


GATCATATTC 


AAGTTAATGC 


780 


TACTTACTTC 


ATCGGGTATT 


TCGATACTAA 


TCGGAATATT 


CATTTCTTGT 


GCACGTAAAA 


840 


TTTT CGCAGT 


AATTAAGCCT 


TTAATTTCAC 


GTACTTTAAG 


ATTCTCGATA 


CCATTTAATT 


900 
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GTAGGCCAGG CATGTCATCT TCTCGAATGT ATTCTGAAAG TGTCGTTAAG ATATTGACAT 1020 

AATCATGACG GAACTTGCGC ATTTCGTTGT TGATAGCTTC AATCTTCAAT GTATATTCAT 1080 

5 AATAGGTTTC AATTTCTTCT TGATTACGTT TATATTTCAT CTCTTTAAGG AGAAATTGAG 1140 

AAATAACAAA TGTTAATATA CTTAAAAATA TAGTGATACC AATAAAAATA AAAGAATACT 1200 

GCCTTATTAC TTTAGCTTCA TCCGAGTTTA TTTGTGAATA AAAGAAAAAT AATGAAAAAG 1260 

10 

TAAGCAGTAA GATAGTCGAA ATAACTATTA AAAATCCTTT GTTTAGTATT AGATATGGTG 1320 

TGCTAATTTT TTTGAGAACT CTATTTATTA TATATGAGAA TAGTATACTA ATAGTCACAT 1380 

AAACTACAAA AAAGCTAGGG AATATTACAA ATATACTATC AGAAATTTTG GTGGATATAT 144 0 

15 

GCATATATAA CTATATACCT GTAGTTAGCA CnGTnATAGG AATAATCnGG CGAGGTCCAT 1500 

AATCCACCAA AATAGAATA 1519 
2Q (2) INFORMATION FOR SEQ ID NO: 73: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5445 base pairs 

(B) TYPE; nucleic acid 
<C) STRANDEDNESS : double 

25 (D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 73: 

30 - 

GTAGGAATCT CTTTGTCTTT TTGGGAGGAC ATTTAATATG AATGTATATT TAGCAGAATT 6 0 

CCTAGGAACT GCAATCTTAA TCCTTTTTGG TGGTGGCGTT TGTGCCAATG TCAATTTAAA 12 0 

GAGAAGTGCT GCGAATGGTG CTGATTGGAT TGTCATCACA GCTGGATGGG GATTAGCGGT 180 

35 

TACAATGGGT GTGTTTGCTG TCGGTCAATT CTCAGGTGCA CATTTAAACC CAGCGGTGTC 240 

TTTAGCTCTT GCATTAGACG GAAGTTTTGA TTGGTCATTA GTTCCTGGTT ATATTGTTGC 300 

TCAAATGTTA GGTGCAATTG TCGGAGCAAC AATTGTATGG TTAATGTACT TGCCACATTG 360 

40 

GAAAGCGACA GAAGAAGCTG GCGCGAAATT AGGTGTTTTC TCTACAGCAC CGGCTATTAA 420 

GAATTACTTT GCCAACTTTT TAAGTGAGAT TATCGGAACA ATGGCATTAA CTTTAGGTAT 480 

45 TTTATTTATC GGTGTAAACA AAATTGCCGA TGGTTTAAAT CCTTTAATTG TCGGAGCATT 540 

AATTGTTGCA ATCGGATTAA GTTTAGGCGG TGCTACTGGT TATGCAATCA ACCCAGCACG 600 

TGATTTAGGT CCGAGAATTG CACATGCGAT TTTACCAATA GCTGGTAAAG GTGGTTCAAA 660 

60 TTGGTCATAT GCAATCGTTC CTATCTTAGG ACCAATTGCC GGTGGTTTAT TAGGTGCAGT 720 

GGTATACGCT GTATTTTATA AACATACATT TAATATTGGT TGTGCAATTG CrATTGTTGT 780 
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CGAATCAATT TACTAAAATA AAAAGAAACG TAAATAGCAT AATTTAACAT GTTTGATTCA 900 
TGGATTATGC TATTTTTTCG CCAAAATTTA ACAGATTTTG TACAATGGGT TAG CGATT AT 960 

5 TTTTTAATAA AGGAGATACT ACTAATGGAA AAATATATTT TATCTATAGA CCAAGGAACA 1020 

ACAAGCTCAA GAGCGATTTT ATTCAATCAA AAAGGGGAAA TTGCAGGGGT AGCACAACGT 1080 

GAGTTTAAGC AATATTTTCC ACAATCAGGT TGGGTTOAAC ATGATGCAAA TGAAATTTGG 1140 

10 

ACATCTGTGT TAGCTGTAAT GACGGAAGTA ATTAATGAAA ATGATGTTAG AGCTGATCAA 1200 

ATTGCAGGTA TCGGTATTAC AAACCAACGT GAAACAACGG TTGTTTGGGA CAAaCATACT 1260 

GGCCGCCCAA TTTATCACGC AATTGTTTGG CAATCACGTC AAACACAATC AATTTGTTCA 1320 

15 

GAATTAAAAC AACAAGGATA TGAACAAACA TTTAGAGATA AGACAGGATT ACTTTTAGAT 1380 

CCGTATTTTG CAGGTACAAA AGTTAAATGG ATTCTAGACA ATGTTGAAGG TGCACGAGAA 1440 

2o AAAGCAGAAA ATGGCGATCT ATTATTTGGA ACGATTGATA CTTGGTTAGT ATGGAAATTA 1500 

TCaGGaAAAg CtGCGCATAT TACTGATTAT TCaAATGCGA GTCGTACATT AATGTTTAAT 1560 

ATCCATGATT TAGAATGGGA CGATGAGTTA TTAGAACTAt TACAGTACCT AAAAATATGT 1620 

25 TGCCAGAAGT TAAAGCTTCG AGTGAAGTAT ATGGTAAGAC AATTGATTAC CACTTCTATG 16 80 

GTCAAGAAGT ACCAATCGCT GGAGTAGCTG GTGATCAACA AGCAGCATTA TTTGGACAAG 1740 

CTTGCTTCGA ACGTGGTGAC GTGAAAAACA CATATGGAAC TGGTGGCTTC ATGTTAATGA 1800 

50 ATACAGGTGA CAAAGCGGTT AAATCTGAAA GTGGTTTATT AACAACAATT GCTTATGGTA I860 

TTGATGGAAA AGTAAATTAT GCGCTTGAAG GTTCCATCTT TGTTTCGGGT TCAGCAATCC 1920 

AATGGTTACG TGATGGATTA AGAATGATTA ATTCAGCACC ACAATCAGAA AGTT ATG CG A 1980 

35 

CACGAGTTGA CTCTACTGAG GGTGTTTATG TTGTTCCAGC TTTTGTAGGT TTAGGAACAC 2040 

CATMTGGGA TTCTGAAGCA CGTGGTGCGA TTTTCGGTTT AACACGTGGA ACTGAAAAAG 2100 

AG CACTTT AT CCGTGCAACT TTAGAATCAC TATGTTACCA AACTCGTGAC GTTATGGAAG 2160 

AO 

CAATGTCAAA AGACTCTGGT ATTGATGTCC AAAGTTTACG TGTCGATGGT GGTGCAGTTA 2220 

AAAATAACTT TATTATGCAG TTCCAAGCAG ACATTGTTAA TACTTCTGTT GAAAGACCTG 2280 

45 AAATTCAAGA AACTACAGCT TTAGGTGCTG CATTTTTGGC AGGTTTAGCA GTTGGATTCT 2340 

GGGAGAGTAA AGATGATATC GCTAAAAACT GGAAATTAGA AGAAAAATTC GATCCGAAAA 24 00 

TGGATGAAGG CGAAAGAGAA AAATTATATA GAGGTTGGAA AAAAGCTGTT GAAGCAACAC 2460 

so 

AAGTTTTTAA AACAGAATAA ACTTGTAGAT TAGACTTTTG TATAAACATT GTGATACAAT 2520 

CAATTTAAGT TAATATTTGA ATCGAGAAGC GAGAGATTTG TTCGAACATG TACAATTGAA 2580 
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GCATTGTCTA CTTTTAAGAG AGAACATATT AAAAAGAATT TAAGAAATGA TGAATATGAT 2700 

TTAGTAATTA TTGGTGGCGG TATTACAGGT GCAGGTATTG CACTAGACGC GAGTGAAAGA 2760 

GGAATGAAAG TTGCATTAGT TGAAATGCAA GACTTTOCAC AAGGAACAAG CTCAAGATCT 2820 

ACAAAATTAG TCCATGGTGG TTTGCGTTAC TTAAAACAAT TCCAAATTGG AGTAGTTGCC 2880 

GAAACTGGTA AAGAACGTGC GATTGTTTAT GAAAATGGGC CTCATGTTAC GACTCCAGAG 2940 

TGGATGCTTT TACCAATGCA TAAAGGTGGA ACATTTGGTA AATTCTCAAC ATCAATTGGT 3000 

TTAGGAATGT ATGATCGTTT AGCAGGTGTT AAGAAGTCTG AACGTAAAAA AATGTTATCT 3060 

AAAAAAGAAA CTTTAGCTAA AGAACCATTA GTTAAAAAAG AAGGTCTAAA AGGCGGCGGT 3120 

TACTATGTTG AATATCGTAC TGACGATGCG CGTTTAACTA TTGAAGTTAT G AAG CGTGCT 3180 

GCTGAAAAAG GCGCAGAAAT TATCAACTAT ACTAAATCTG AACACTTCAC TTATGATAAA 324 0 

20 AATCAACAAG TAAATGGTGT TAAAGTTATA GATAAATTAA CTAATGAAAA TTATACAATT 33 00 

AAGGCTAAAA AAGTGGTTAA TGCAGCAGGT CCATGGGTTG ATGATGTTAG AAGTGGTGAT 3360 

TATGCACGCA ATAATAAAAA ATTACGTTTA ACTAAAGGTG TACATGTTGT TATTGATCAA 3420 

TCAAAATTCC CATTAGGTCA AGCAGTATAC TTTGATACTG AAAAAGATGG AAGAATGATT 34 80 

TTTGCAATTC CACGTGAAGG AAAAGCGTAT GTAGGTACTA CAGATACATT CTATGACAAT 3540 

ATCAAATCTT CACCATTAAC TACACAAGAA GACAGAGACT ATTTAATCGA TGCGATTAAT 3 600 

TACATGTTCC CTAGTGTTAA TGTTACAGAT GAAGATATTG AATCAACATG GGCAGGAATT 3660 

AGACCATTAA TTTACGAAGA AGGCAAAGAC CCTTCTGAAA TCTCTCGTAA GGATGAAATT 3720 

TGGGAAGGTA AATCAGGTTT ATTAACTATT GCAGGTGGTA AATTAACAGG CTATCGTCAC 3 780 

ATGGCTCAAG ACATTGTTGA TTTAGTATCT AAACGCTTGA AAAAAGACTA CGGTTTAACA 3 840 

TTTAGTCCAT GTAATACAAA AGGTCTGGCA ATTTCAGGTG GCGATGTAGG TGGTAGCAAG 3 900 

40 AACTTTGATG CGTTTGTAGA GCAAAAAGTA GATGTAGCTA AAGGATTCGG CATTGATGAA 3 960 

GATGTTGCAA GACGTTTAGC ATCTAAATAT GGTTCAAATG TTGATGAATT GTTCAACATT 4 020 

GCGCAAACAT CTCAATACCA TGATAGCAAG TTACCATTAG AAATTTATGT AGAACTTGTT 4 080 

45 TATAGTATTC AACAAGAAAT GGTATACAAA CCTAACGATT TCTTAGTTCG TCGTTCTGGT 4140 

AAAATGTATT TCAATATTAA AGATGTATTA GATTATAAAG ATGCTGTCAT CGATATTATG 4200 

GCAGATATGC TTGATTACTC TCCAGCTCAA ATTGAAGCAT ATACTGAAGA AGTTGAGCAA 4260 

50 

GCAATTAAAG AAGCGCAACA TGGaAATAAT CAACCAGCAG TTAAAGAATA At TAATTTGT 4320 

ACAATCATAA ACTGGTGTCC TGTTTTAAGG GCATCAGTTT TTTTATACGA GATACATTAG 43 80 
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GTTATTAAAG GTOTGAGATG ATGACTGAAA AACAATTTAA ATTAACTGTA CAAGATAATA 4500 

CGAATATTGA AGTTAAAGTG AATTTTACAG ATGTAGATTC AAAAGGAATT ATTCATATAT 4560 

TTCATGGTAT GGCTGAACAT ATGGAACGTT ACGATAAATT AGCACATGCA CTTTCAAAGC 4620 

ATGGCTTCGA TGTGATACGT CATAATCATC GAGGACATGG TATTAATATT GATGAATCAA 4660 

CAAGAGGGCA TTACGATGAT ATGAAACGAG TTATCGGTGA TGCCTTTGAA GTAGCGCAAA 4740 

CAGTGAGAGG CAATGTTGAT AAACCATACA TTATAATCGG ACATTCAATG GOATCCGTTA 4800 

TAGCTAGATT GTTTGTAGAA ACATATCCGC AATATGTTGA TGGTCTAATT TTAAGTGGTA 4860 

CTGGTATGTA TTCATTATGG AAAGGTTTAC CAACCGTTAA AGTGTTACAA CTOATTACAA 4920 

AAATTTATGG TGCTGAGAAA OGAGTTGAAT GGGTTAACCA GTTAGTATCA AATAGTTTTA 4980 

ATAAAAnnAT ACGTCCATTA CX3TACACAAA GTGATTGGAT TTCTAGTAAT CCAATTGAAG 5040 

2o TAGATAaCTT TATTAAAGAT CCATATAGTG GaTTTAATGT GTCAAATCAA TTATTATATC 5100 

AAACAGCCTA TTATATGCTA CATACATCAC AATTAAAAAA TATGAAAATG TTAAaTCATG 5160 

CCATGCCTAT ATTATTAGTT TCAGGATATG ACGATCCTTT AGGTGATTAT GGTAAAGGGA 5220 

25 TTTTAAAATT GGCGAATATA TATAGAAACG CTGGCATnAA AAATGTTAAA GTGAATCTTT 5280 

ATCATCATAA ACGTCATGAA GTGTTATTTG AAAAnGATCA TGACnAAATT TGGGAAGACT 5340 

TGTTTAAATG GTTGAATCAA TTTTATAAAA AATAAAGAAA GTGGAATTAA ATATGAATAA 5400 

30 

AAATAAGCCT TTTATTGTAG TAATTGTGGG GCCAACTGCT TGCAG 5445 

(2) INFORMATION FOR SEQ ID NO: 74: 

(i) SEQUENCE CHARACTERISTICS: 
35 (A) LENGTH: 2569 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
~ (D) TOPOLOGY: linear 

40 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 74: 
TGGCTTGAAC TACGCCAATA AGTCCCCCTA GTACAAGAAT GAATACCATG ATATCGACCG 60 
45 CTTCTATCGT ACCTTCAACC ATGCTACTTG TTATTTGTTC TGGTCCAGCT GGATGTTGCT 120 

TTAATCTTTC ATAAGTATTC GGAATTGATA CCGGCTTATT AATTGCACCT GATTTAAATT 180 

GTTCAATCTT AATTTTAACC CCCATTTTGT CTAGTTCCTG TTGCGTACCC GGAACCTTTT 240 

50 

TCACTTGGTT ATGAGGGTTA ACTATCTTTA GTTCTTGGGA TGAAGGTTCG TAAGAAAGTT 300 

TAGAATATGC ACCAG CAGG A ATAACCCATG TTGCTATAAC TGCAACAACC GTTAAAATGA 3 60 
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TAATTGTATT TTCCACGGTT TCATCTCCTT CGACATTTAA CCTAGCATTT CTACCTTAAA 480 

GATTTTATAA ATATAAATTA AGAAAGTGCA CCCCGCATCA AAATAGAGGC ATTATTTTCA 540 

GGGGGTGCAC ATAAATAATA AAAATCATGC ATTTGACATA TAGTAATTGA AAAGCGTTTC 600 

AATTCAATTA CTTTTTAATC ACAGTACCTA CTTTACCCTC TAAGGCAGCA TCTAATTCAT 660 

TTAATGATGT TATAAGCACA CTTCCTTTTG GATTGTTTTC AATAAATGAT ATGGCTGCTT 720 

CAATTTTTGG TAACATACTT CCTTTTGCAA ATTGATTTTC GTCTATATAT CGTTTTAATT 780 

CATCAACATT TGTTGTTTTC AAAGGCTGTT GGTTTTCAGT GTTAAAATTA ATATATACAT 840 

AATCAATTGC TGTTAAAATA ATCAATTGAT CGCATTGAAT ATTAGCACCC AACAACGCAC 900 

TTGTTTTATC TTTGTCTATA ACTGCATCAA TACCTTTAAA ACCATCATGT TGCTCTCTAA 960 

TTACTGGTAT ACCTCCACCA CCAGCAGCAA TAACGAGTGT ATCATTTTTA ATAAGTGTTT 1020 

20 TAATACTCTC TAATTCAATA ATAGAGATGG GTTGTGGTGA AGGAACAACG CGTCTATATC 1080 

CTCTTCCAGC ATCTTCAACA AATATAAATC CTTTTTCTTT TTGAATTTGT TCAGCTTCTT 1140 

CTTTGTTGTA AAATAACCCA ATTGGTTTTG AAGGATTGTT AAATGCCGGA TCATTTTCAT 1200 

CAACTTCAAC TTGTGTCACT AGTGTTACCA CTTGTTTATC CATTCCAATA GAATGCAATT 1260 

CATTTTGTAA GCTTTCTTGT AATTGATAGC CGATGTAAGC TTGACTCATT GCGCCACATT 1320 

CAGCAAATGG AAATGCCGGA CCTTGGTTAT GTTCTGCAGC ATAGTTAAGT CCCAAATTAA 1380 

TGCTTCCAAC CTGTGGTCCA TTACCATGAC TAATAACAAT CTCATGTCCT TTTGTnATTA 1440 

AyCCTACTAA TGATTt CGCA GTATTTTTAA CAAGCTCGAG TtGgTyCTTG aGGTGATTTn 1500 

CCTAAAGCAT TACCACCTAA TGCTACTACT ATTTTCGCCA TCATATTCAC TTCCTTATAT 1560 

CATTTAAAAT TCACCCAATG TAGCAACCAT GaCTGCTTTG ATTGTATGCA TTCTGTTCTC 162 0 

AGCTTCTTGG AATACAACTG AAGCTTTACT TTCGAATACT TCATCTGTAA CTTCCATTTC 1680 

40 TCGAATACCA TATTTTTCAA AAATTTGTTG ACCTATTTTC GT AT CAG CAT TATGGAAAGA 174 0 

TGGTAAGCAA TGCTCAAAAA TAACATTTGG ATTACCAGTT TTATCCATTA TTTCTTTATT 18 00 

TACTTGATAT GGTTTCAATA ATTCAAGTCG TTCTTTCCAT ACTTCATCAG GTTCACCCAT 1860 

45 TGATACCCAA ACATCAGTGT AAATTACATC CGAACCTTTT ACaCCTTGGT CaATATCATC 1920 

TGTGATTAAT ATGTTGCCaC CATTTTCaGC GGCAATATTT TTACAGCGAT TTAATAATTC 1980 

ATCTGTTGGA TTTAATTCTT TTGGACAAAC TAAATGGAAG TTCATACCCA TAATGGCAGC 204 0 

60 

ACCTTGCATT AATGCATTTG CAACGTTATT ACGACCATCT CCAACATATG TAAAGTTAAT 2100 

ATCTGCATAA TCTTTTTTTA AGACTTCTTT TGCTGTTAAG AAATCAGCAA GAACTTGAGT 2160 
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TTCTACTGTT CTTTGTGAAA AACCACGGTA TTCAATGCCA TCATACATTC CACCAAGCAC 2280 

ACGTGCAGTA TCTTTAGTTG TTTCTTTTTT ACCCATTTGT GATCCAGTTG GGCCTAAATA 2340 

5 AGTTACATTT GCACCTTGAT CATGCGCTGC AACTTCAAAT GCACATCGCG TTCTTGTAGA 2400 

ATCTTTTTCA AATAACAGTG CAATATTTTT ATTTTTTAAC ATAGGCTTTT CAGTGCCAAT 2460 

ATATTTAGCA CGTTTTAAAT CCTCGGAGAG TGTTAATAAG GTTCTACCTC TTGTCGTGAA 2520 

10 

AAGTCTAATA AAGTTAAAAA ACTTCTGTTT CGTAnATTTT TCATTAAnA 2569 

(2) INFORMATION FOR SEQ ID NO: 75: 

<i) SEQUENCE CHARACTERISTICS: 
15 (A) LENGTH: 1273 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

20 

<xi> SEQUENCE DESCRIPTION: SEQ ID NO: 75: 

CCTGGAACCA TCCaATCGtG CaAATCtTGa AAGaGAATAC GCAACAACAA TTAAATGTAT 60 

25 TGGAACACTA TATTCCAAAT GACCATCCAG CACTCGTTGA ATTAAAAATA TGGGAACGTT 120 

GGTTACATAA ACAAGGTTAC AAAGACATCC ATTTAGATAT TACTGCGCAC CACCTAGATC 180 

CTATTACACA GGTTTATTTA TTCAATGTCA TTTTGCTGAA AATGAATCTC GAGTTTTAAC 24 0 

AGGTGGTTAT TACAAAGGAA GCATCGAAGG GTTTGGATTA GGATTAACAC TTTAAGTAAG 300 

GGAGTATGCA CAATGTTAAG AATCGCCATA GCCAAAGGAC GTCTAATGGA TAGTTTAATT 360 

AACTATTTAG ATGTAATTGA ATATACGACA TTATCAGAAA CATTAAAAAA TAGAGAACGC 42 0 

CAATTATTAT TAAGTGTAGA TAATATTGAA TGCATTTTAG TAAAAGGAAG. TGAOGTGCCA 480 

ATCTATGTGG AACAAGGAAT GGCAGACATA GGCATTGTTG GTAGCGACAT ATTAGATGAG 54 0 

CGCCAATATA ATGTTAATAA TTTGTTGAAT ATGCCTTTTG GAGCATGTCA TTTTGCGGTT 600 

GCAGCGAAAC CTGAAACGAC CAATTATCGT AAAATCGCAA CGAGTTATGT TCATACTGCT 660 

GAAACATATT TTAAATCAAA AGGTATTGAT GTCGAATTGA TTAAATTGAA TGGCTCTGTT 720 

45 GAATTGGCCT GTGTTGTAGA TATGGTAGAC GGAATTGTCG ACATCGTTCA AACAGGTACT 780 

ACGCTAAAAG CGAACGGACT GGTTGAAAAG CAACATATTA GTGATATCAA TGCAAGATTA 84 0 

ATAACTAATA AAGCAGCTTA TTTTAAAAAA TCACAATTAA TAGAGCAATT TATTCG CTCT 900 

50 TTGGAGGTGT CTATTGCCAA TGCTTAATGC ACAACAATTT TTAAATCAAT TTTCATTAGA 960 

AGCACCATTA GATGAGTCAT TGTATCCaAT TATTCG CGAT ATTTGTCAGG AAGTTAAAGT 1020 
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TTTAG aAATT AGTCATGAmC AAATTAAAGC AGCATTTGAC ACATTAGATG AAAAAACAAA 1140 

ACAAG CATT A CAACAAAGTT ATGAAAGAAT TAnAGCATAT CAaGAAaGTA T t aAACAGaC 1200 

GaATCAACAG TTAGAAGaAT CAGTGGaGTG tTrTGaAATA TACCATCCmC taGaAAGTGT 1260 

CGGTATTTAT GTG 1273 



(2) INFORMATION FOR SEQ ID NO: 76: 

10 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1308 base pairs 

(B) TYPE: nucleic acid 
<C) STRANDEDNESS : double 
(D) TOPOLOGY: linear 

15 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 76: 



20 


GTTGATAAAT 


TAAAAATGTT 


TTTATCAGAT 


ATTCAAAGTT 


ACCAACAATA 


TAGTAAAGAT 


60 




CATCCGGTGT 


ATCAGTTAAT 


TGATAAATTT 


TATAATGATC 


ATTATGTTAT 


TCAATACTTT 


120 




AGTGGACTTA 


TTGGTGGACG 


TGGACGACGT 


GCAAATCTTT 


ATGGTTTATT 


TAATAAAGCT 


180 


25 


ATCGAGTTTG 


AGAATTCAAG 


TTTTAGAGGT 


TTATATCAAT 


TTATTCGTTT 


TATCOATGAA 


240 




TTGATTGAAA 


GAGGCAAAGA 


TTTTGGTGAG 


GAAAATGTAG 


TTGGTCCAAA 


CGATAATGTC 


300 




GTTAGAATGA 


TGACAATTCA 


TAGTAGTAAA 


GGTCTAGAGT 


TTCCATTTGT 


CATTTATTCT 


360 


30 


GGATTGTCAA 


AAGATTTTAA 


TAAACGTGAT 


TTGAAACAAC 


CAGTTATTTT 


AAATCAGCAA 


420 




TTTGGTCTCG 


GAATGGATTA 


TTTTGATGTG 


GATAAAGAAA 


TGGCATTTCC 


ATCTTTAGCT 


480 


35 


TCGGTTGCAT 


ATAGAGCTGT 


TGCCGArAAA 


GAACTTGTGT 


CAGAAGAAAT 


GCGATTAGTC 


540 


TATGTAGCAT 


TAACAAGAGC 


GAAAGAACAA 


CTTTATTTAA 


TTGGTAGAGT 


GAAAAATGAT 


600 




AAATCATTAC 


TAGAACTAGA 


GCAATTGTCT 


ATTTCTGGTG 


AG CACATTGC 


TGTCAATGAA 


660 


40 


CGATTAACTT 


CACCAAATCC 


GTTCCATCTT 


ATTTATAGTA 


TTTTATCTAA 


ACATCAATCT 


720 




GCGTCAATTC 


CAGATGATTT 


AAAATTTGAA 


AAAGATATAG 


CACAAATTGA 


AGATAGTAGT 


780 




CGTCCGAATG 


TAAATATTTC 


AATTGTGTAC 


TTTGAAGATG 


TGTCTACAGA 


AACCATTTTA 


840 


45 


GATAATGATG 


AATATCGTTC 


GGTTAATCAA 


TTAGAAACTA 


TGCAAAATGG 


TAATGAAGAT 


900 




GTTAAAGCAC 


AAATTAAACA 


CCAACTTGAT 


TATCGATATC 


CATATGTAAA 


TGATACTAAA 


960 




AAGCCCTCAA 


AACAATCTGT 


TTCTGAATTG 


AAAAGACAAT 


ATGAAACAGA 


AGAAAGTGGC 


1020 


60 


ACAAGTTACG 


AACGAGTAAG 


GCAATATCGT 


ATCGGTTTTT 


CAACGTATGA 


ACGACCTAAA 


1080 




TTTCTAAGTG 


AACAAGGTAA 


ACGAAAAGCG 


AATGAAATTG 


GTACGTTAAT 


GCATACAGTG 


1140 
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GATGGATTAA TCGATAAACA TATTATCGAA GCAQATGCQA AAAAAGATAT CCGTATGGAT 
GAAATAATGA CATTTATCAA TAGTGATTAT ATTCGATATT GCTGAAGC 
(2) INFORMATION FOR SEQ ID NO: 77: 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1431 base pairs 

(B) TYPE: nucleic acid 
<C) STRANDEDNESS : double 
(D) TOPOLOGY: linear 



<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 77: 
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ViATGCCAi m 


ATnnGTATGC 


AAGAAGTTGT 


TCCGGGTTCA 


GGTGGATTaC 


CAGTTGGTAC 


60 


TCjUTUGTAAG 


ACGTTACTAA 


TGCTTTCAGG 


CGGTATAGAC 


TCACCAGTTG 


CTGGGATGGA 


120 


AGTGATGAGA 


OGTGGCGTAA 


CAATTGAAGC 


GATTCATTTC 


CATAGTCCAC 


CATTTACAAG 


180 


f|YM JV ^/"^ TV TV**"»/-»T\ 

IvjATtJAAGCA 


AAAGAAAAAG 


TTATTGAATT 


GACACGTATT 


TTAGCTGAAC 


GTGTTGGACC 


240 


nAl 1 AAA I iVj 


CATATTGTAC 


CATTTACAGA 


ATTGCAAAAA 


CAGGTAAATA 


AAGTTGTACA 


300 




ACAATGACTT 


CAACGAGACG 


TATGATGATG 


CGTGTTGCTG 


ATAAATTAGT 


360 


nwii Liulnl 




CTATTGTAAA 


TGGTGAAAAC 


CTAGGGCAGG 


TAGCCAGTCA 


420 






CAAx lAATAA 


TGTAACTTCT . 


ACTCCTGTAT 


TACGTCCTTT 


480 


ATTAACTTAC 


GATAAAGAAG 


AAATTATTAT 


TAAATCGAAA 


GAAATTGGTA 


CATTTGAAAC 


540 


ATCTATTCAA 


CCATTTGAAG 


ATTGTTGTAC 


AATTTTCACC 


CCTAAAAATC 


CAGTAACCGA 


600 


ACCAAACTTT 


GATAAGGTAG 


TCCAATATGA 


AAGTGTCTTT 


GATTTTGAAG 


AGATGATTAA 


660 


TCGTGCTGTT 


GAAAATATTG 


AAACACTTGA 


AATAACTAGT 


GATTATAAAA 


CTATTAAAGA 


720 


ACAQCAAACA 


AACCAATTAA 


TAAACGACTT 


TTTATAAATA 


AAATCCTAGA 


GTAAATTTAA 


780 


ACATAAGGGG 


ATGTTAAACT 


ATGGATTTGA 


ACTTAACGAT 


GATTATAATC 


ATAATTTTAT 


840 


TTGGTTTTAT 


CGCGGCGTTT 


ATAGATTCGG 


TTGTAGGGGG 


TGGCGGTTTA 


ATTTCTACGC 


900 


CAGCATTATT 


AGCAATCGGT 


CTACCACCAT 


CTGTGGCTTT 


AGGTACAAAT 


AAATTGGCAA 


960 


GTTCGTTTGG 


TTCTTTAACT 


AGTACGATAA 


AGTTTATAAG 


GTCCGGTAAA 


GTGGACTTAT 


1020 


ATGTTGTTGC 


CAAATTATTT 


GGTTTTGTAT 


TTTTGGCATC 


TGCATGTGGC 


GCATATATTG 


1080 


CAACGATGGT 


TCCGTCACAA 


ATATTGAAAC 


CTTTAATCAT 


CATTGCACTT 


TCGTCGGTGT 


1140 


TTATATTCAC 


ATTACTTAAA 


AAAGATTGGG 


GCAATACACG 


CACGTTTACT 


CAATTTACAT 


1200 


TTAAGAAAGC 


CATAATATTT 


GCAGCACTTT 


TTATATTAAT 


CGGCTTTTAT 


GATGGATTTG 


1260 
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TAAGTGCAGC AGGAAATGCT AAAGTTTTGA ACTTTGCTTC TAATATAGGT GCGCTTGTAT 1380 
TATTTATGGT ATTAGGACAA GTAGATTATG TAATAGGTTT AATTATGGCT A 1431 

5 

<2) INFORMATION FOR SEQ ID NO: 78: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4403 base pairs 

(B) TYPE: nucleic acid 

10 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



20 



25 



,5 (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 78: 

AATATTATTT TAAATTCAAT ATTTATTGGT GCATTTATTT TAAACTTATT ATTCGCCTTT 60 

ACCATTATTT TCATGGAAAG ACGTTCTGCC AATTCTATCT GGGCTTGGTT ACTAGTCTTA 120 

GTTTTCTTGC CTTTATTCGG CTTCATTTTA TACTTACTAT TAGGACGACA AATTCAACGT 180 

GACCAAATTT TCAAAATTGA TAAGGAAGAT AAAAAAGGAT TAGAGTTAAT OGTTGATGAG 24 0 

CAATTAGCTG CTTTAAAAAA TGAAAACTTT TCAAATTCCA ATTATCAAAT TGTAAAATTT 300 

AAAGAAATGA TTCAAATGTT GTTATATAAT AACGCAGCAT TTTTAACAAC AGACAACGAT 360 

TTArrrrtAT ACACAGACGG CCAAGAAAAA TTTGATGACC TAATACAAGA CATCCGTAAT 420 

GCTACTGATT ATATTCATTT TCAGTACTAT ATTATTCAAA ATGATGAATT AGGTCGTACC 4 80 

ATTTTAAATG AACTTGGTAA AAAAGCGGAA CAAGGTGTAG AAGTTAAAAT TCTTTATGAT 540 

GACATGGGTT CT CGTGG ACT GCGTAAAAAA GGCTTACGCC CGTTTCGCAA TAAAGGTGGA 600 

CATGCTGAAG CATTTTTCCC ATCAAAATTA CCTTTAATTA ACTTGCGTAT GAACAATCGA 660 

AACCATCGAA AAATTGTTGT AATAGATGGG CAAATTGGAT ATGTTGGTGG TTTTAATGTT 720 

GGTGATGAGT ACTTAGGTAA ATCAAAAAAA TTCGGCTATT GGCGAGATAC GCATTTACGA 780 

40 ATTGTCGGGG ATGCAGTGAA TGCATTGCAA TTACGATTTA TTCTAGATTG GAATTCACAA 640 

GCCACACGTG ACCACATCTC CTATGATGAT CGTTATTTCC CAGATGTAAA TTCTGGTGGA 900 

ACAATTGGCG TTCAAATAGC TTCTAGTGGT CCTGACGAAG AATGGGAACA GATTAAATAC 960 

GGCTATTTGA AAATGATTTC ATCTGCTAAA AAATCGATTT ATATTCAATC TCCCTATTTC 1020 

ATACCTGATC AAGCCTTTTT AGATTCTATT AAAATTGCGG CATTAGGTGG TGTTGATGTC 1080 

AATATCATGA TTCCTAATAA ACCTGACCAT CCGTTTGTTT TTTGGGCTAC TTTAAAAAAT 1140 

GCAGCATCCT TATTAGATGC CGGTGTTAAA GTATTTCACT ACGACAATGG CTTTTTACAC 1200 

TCAAAAACAC TTGTTATAGA TGATGAAATT GCAAGTGTGG GAACAGCTAA TATGGACCAT 1260 
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AAATTAAAAC AAGCTTTTAT AGATGATTTA GCAGTATCTT CTGAATTAAC AAAAGCACGT 1380 

TATGCTAAGC GAAGTCTTTG GATTAAATTT AAAGAAGGTA TTTCACAATT ATTGTCACCT 1440 

ATCTTATAAA ATAGAAATAT GAGGAGTGTA aCTTTAATGC AACAATCAGA CGTCATTAGT 1500 

GCTGCCAAAA AATATATGGA ATCTATTCAT CAAAATGATT ATACAGGCCA TGATATTGCG 1560 

CATGTATATC GTGTCACTGC TTTAGCTAAA TCAATCGCTG AAAATGAAGG TGTTAATGAT 1620 

ACTTTAGTCA TTGAACTCGC ATGTTTGCTT CATGATACOG TTGACGAAAA AGTTGTAGAT 1680 

GCTAACAAAC AATATGTTGA ATTGAAGTCA TTTTTATCTT CTTTATCACT ATCAACCGAA 1740 

GATCAAGAGC ACATTTTATT TATTATTAAT AATATGAGCT ATCG CAATGG CAAAAATGAT 1800 

CATGTCACTT TATCTTTAGA AGGTCAAATT GTCAGGGATG CAGATCGTCT TGATGCTATA 1860 

GGCGCTATAG GTGTTGCACG AACATTTCAA TTTGCAGGAC ACTTTGGTGA ACCTATGTGG 1920 

ACAGAACATA TGTCACTAGA TAAGATTAAT GATGATTTAG TTGAACAGTT GCCACCATCT 1980 

GCAATTAAAC ATTTCTTTGA AAAATTACTT AAGTTAGAAT CTTTAATGCA TACAGATACG 2040 

GCGAAGATGA TTGCTAAAGA ACGTCACGAC TTTATGATGA TGTACTTGAA ACAGTTTTTT 2100 

ACGGAATGGA ATTGTCACGA CTAGACATTG AAGTTG TAGT ATGATGATGC GATGTAATGG 2160 

CGTGTTGTTG TGGAAGCTTG GTGTCATGCC ATGTTACTTT GATGTGTTGT TGTGGGAGCT 2220 

TGGTGACATG TCATGCTACT TTGATGTGCT GGTACCACGA TGCGTCTTGA TGTAGTGCTA 2280 

TGATGTGGCA TTGCGGTGTT ATGGTGTTAT AGACAGGTTT GGCGTTGATG CCATGTTACT 2340 

TTGATGTGCT GGTACCACGA TGCGACTTGA TGTAGTGCTA TGATGTGGCA TTGCGGTGTT 24 00 

ATGGTGTTAT AG AC CGGTTT GATGTTGATG CCATGTTACT TTGATGTGCT GGTGCTACGA 24 60 

TGCGACTTGA TGTAGTGCTA TGATGTGGCG TTGCGCTGTT ATGGTGTTAT " AGCCAGGTTT 2520 

GGTG3TGATG TCATGCCGTT ACGATTCTAT GATATGTTGT TGGGACGTTG CAATGTGTAT 2580 

TATGCCGTTG TGACGTTATT ATTTCACACT GTTACATGTA TAAGTGAATT GCTGTGGAAA 2640 

TTTGCGACAT ATACTGCTAC ACTGATGAAT CATTGTGTCA AGATGACATT GCGATGAAGA 2700 

ATGACAACTC TGTTATTAAC CACTTTTTAC ATACTGAAAA CTCGTTAATA TTATTTCAAA 2760 

TAAAAACAGC AGTAGGATGA CTTTCACATT TGAAATCATC TTACTGCTGT TTCTATTTAT 2820 

CACATATTGT ATAATGTGAC ACTAAGTTTC GCTATTGAAG CGAAAAATAA TGTGCGCCCT 2880 

ATAAAGTTAA AATTATCTTC AACTTTTAGG GTGCACATTA TTTGGACTTG CTAAGGTTAT 294 0 

TTCTTTTTCT TTTTAGACAC AACTTGTGTG TTTTTGCCTT TTTTATTGct GCCGCCGTTG 3 000 

TGCTCTCTTT CATACGCTTC AATGAAAGGT TGTACTTCTT TTTTAGCGAC TTTTTCATAA 3060 
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CCAAGTGCTO ATGCTGAGCT TAATGAAATC CAGATAATCA TAATTGGTGA AATGACCATC 3180 

ATCATGTAAC CCATTTGACG TTGTTCGTCT GGCATCGTTT TACTTGATAC ATATGCTTGG 3 240 

ATAAAGTATA AAACACCGGC AATAATTGTA ATCCAAATAT CAGGACGTCC TAAATCGAAC 3300 

CATAAGAAGT GTGGATATTT AAACAAACCA TCTACAAGTT GGTCTTTAAG TACAAAGTAT 3360 

AATCCCATGA TGATTGGTAA TTGGATTAGC ATTGGTAAAC AACCCAACAT ACTCTTAATC 34 20 

GGGTTCATGT CATACTTTTT ATATACTTGC ATTAATTCTT GGTTTGCAGC CATTTTTTCT 34 BO 

TCTTGTGTAC GCGnCaCGTT cACTTTTTCT TGAATTTTTT CAACTTCTGG CTTTGCAACT 3540 

TTCATTTTTT GACGCATCAT ATGACTATTT TTATAGTTTG ACAACATGAA TGGTAATAAA 3600 

ATAATACGAA TTACCAATAC AAGGATAATA ATAGCTAAAC CATAATTGTC GTTTAATAAG 3660 

TTATTTCCCA ACCAATCCAA TACATTTTTC ATTGGATCTA CGAATGTATT GTAGAAAAAy 372 0 

20 cwCtACGTTT TTCAGGTTTA GAATAGTCAC AACCAG CCAA AAAGACCATA ATACCTAAAA 3780 

ATAATGGTAG TAACGCTTTT TTCTTCATTT TTCCACCTCT ATCATTATAT TCACATAGGA 3840 
TTTATTCTAT CACATTAATG AGTACGTATG AAACAATAAG TGGAAAAATT TAACTAATTA * 3900 

TTAAAAAAAT CTTTGAATCG ATTAACAGTC TTTTCAATAT TTTCACTTTT AGAAATGGCT 3 960 

GAAATGACTG AAATTCCATT GGCACCTGCT TCTACAATCG GCGCCACATT ATTAGTATTG 4020 

ATACCGCCAA TAGCTACAAT CGGTAGTTGC GGATTCATTT CTTTAAACGT TGCAATCATT 4 080 

TCTGGACCTA CTGGTATATG CGCGTCATGC TTCGACGGCG TAGGATAGAT TGGTCCAACA 414 0 

CCTATATAAT CmACATGAGT TAAATCAGAT TTTGCATACT CATCTAAATC ACTAATACTA 4 200 

AGTCCAATAA TTTTATCAGT GAAATATTGT GCTATCTCTT TGACTTTCGC ATCATCTTGA 4 2 60 

CCGACATGTA TACCATCCGC GTTAATTTCT TTTGCCAAGG ATACATCATC ATTAACGATA 4320 

AAAGGCACAT CATATTGATG ACAGAGATGC TGTAATTCTT TAGCTAATAC AAGTTTATCG 4380 

40 TTTCCTTTTA AAGCTGATTC ACC 4403 
(2) INFORMATION FOR SEQ ID NO: 79: 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1808 base pairs 

(B) TYPE: nucleic acid 
<C) STRANDEDNESS : double 
<D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 79: 
TGGAnCCAAT ATTAGAAATG ATTAAAACAT TAACAGGTAT TAATAGTCCT TCAGGAGnCA 6 0 
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TAACAAATAA AGGTGCGTTA TTAATAACAO TGCCAGGCAA 
GTATTACTGC TCATGTTGAT ACTTTAGGTG CaATGGTTAA 
GCTTaGCAAT AGAATTAATT GGAGGATTCA CGTATAACGC 
AAATTAAAAC TGATGCTGGT CAAATATATA CAGGAACAAT 
TTCATGTATA TAGAAATAAT CATGAAATAC CTAGAGATCA 
TTGATGAAGT AACTACATCA GAAGAAGATA CAAAGAGTTT 
TTGTTAGCTT TGATCCACGT ACAGTTATCA CGTCATCAGG 
TAGATGATAA AGCTAGCGTA CGgTtGATAC TACAATTACT 
AAATAATATT ACCACATACA ACGCAATTTT ATATTTCTAA 
GTGCAAATGC ATCAATTGAT TCGAAAATCA AAGAATATAT 
TGGGAGACGG TCAAGCATCG GATGAATATA CAGTTTCTAT 



GTCCATATCA TAAGCAATTG AAATCGCACC TAGTTAATCT 
CATATAAAGT AGACATATAT CCATATTATG GTTCAGATGC 
GTGCGGATAT CAGACATGGT TTATTTGGCG CTGGCATTGA 
GAACACATAT TGATTCTATT AAAGCGACAG AGAAATTACT 
CAATTGAGTA AACAATTAGT GTTGACAAAT GTGaACGACC 
AAAAATAATT AGAATTTTCT AAAGAAATAG TAG CAGAT AT 
CTAATGGGTG ATGGGAATTA GCACGCCATA TCTTGTGAAT 
AATGAGTTTT GAAAGTGAAC ATGAATTATG TTAACTAAGG 
CTTACAGGTA TATGCGTTAT GTGGTGTCTT TTTATTTAGA 
AAGCTAGCAA CAGAAAGTTA GTGGATGATG TGAACTAACA 
TTTTGTCTGC AACAGAAAAA TTATATATAG TAAAGAGTGA 
TCGGTTAATT TAGGTGGTAC CACGCGTCAC nTCCTTTATA 
TTTTTG AAAG GAGCGTATAG AATGGATATA TTTTATAAAA 
CCCGAAGTTT TAGCACAACT TCATTCCAAG AAGaTCATTT 
CAAACTAAAG GTCGCTATTC AGTTGTTATT TTTGATATTT 
AATGATGTAT TATCAGTAAG TACTTTAAAA GAATCGTATC 
CATTATTTAA CGACTAAnAT AAATGAAGAC TACCATAATA 
AGTCATTA 



AAATGATGAA GTACAACGCT 180 

AGAAATTAAA GAAGATGGTC 240 

GATTGAGGGT GAATATTGCC 300 

TTGTCTGCAT GAAACAAGTG 360 

AAAGCATATG GAAATAAGAA 420 

AGGTATTTCA GTAGGTGATT 480 

TTTTATTAAA TCTCGTCATT 540 

AAAGAAATTA AAAGAAGAGC 600 

TAACGAAGAA ATAGGTTACG 660 

TGCATTAGAT ATGGGCGCGT 720 

TTGTGCCAAA GATGCTTCAG 780 

TTGCAAAATA AATAACATTC 840 

TTCAGCAGCT TTACATGCTG 900 

ATCATCTCAT GCAATGGAAC 960 

ATATGCATAT TGCTTATCAC 1020 

TATGTAATAT AATGAACTAT 1080 

GAAACGTAGC AAATAGAAAG 1140 

TGGACTTTGG AAAACAATTG 1200 

TGGCACCACG GTAACG OGTC 1260 

CAAAATGTAG TAGTTAATTA 1320 

CCGAGATTAA TGAAATTGGG 1380 

ACTATGAATA TTTCGAATAT 144 0 

TTGATAAGGA TGCTGGCGCT 1500 

AAATAAAAGC AAATGTAACG 1560 

TGGAAAGTAC AAATCAACAA 1620 

ATGGCACTTT AACTTTAGAT 1680 

AAATCACTGA AAGACCGTAC 174 0 

TTCCAAGATG AGGCAACTTA 1800 

1808 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1320 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



10 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 80: 

TGGTCGTCAA TTTCTTGATT ATATCTATAA TCCTCATTTT CAATATTAGA GTCTGTAGAA 60 

TCATCGATAT TATTATCATT CGCATGACTA GAAGCAGAAT CATTATTTTT ATCATTGCTT 120 

15 TCTTCTTTTT TGAAGTCTTT ATTTATCAAG TAAATTTCTT CATCAAAATC AGCTTGTTGA 180 

GATGTATCAT CTTTATTTTG ATTAGAAAAA TGTGTAGCCT TTGATCTTTT TCTTTGCCGT 240 

CTTTTCTTAG ATGTATTCCT CGTAAATAAT TCTAATTCAT CTTTATCTTC ATTTGATTCT 300 

20 TGTTGATCGT TCTTCGTTTT ATCATCCATC AATACTCACA CCCTTTAATA AGATGGTAAA 3 60 

TGGGCACGGA ATCTTTCAAT AAATTTCTCT CCACGCTCTT CAAAAGTACT ATATTGATCC 420 

CAACTCGCAC AAG CAGGTG A CAATAATACA ACATCATTTG GTTCTATAAT ATCTTGTACT 4 80 

TTATCAACAG CGTCTTCGAC ATTGTTCGCT TCAATGACCG ATTTCCCTTG ACTATTACCT 54 0 

AGTTTAGCAA ACTTAGCTTT CGTTTGTCCG AATACAACCA TCGCGCGAAC ATTTTCCATA 600 

TAAGGAATGA GTTCGTCAAA TTCATTCCCT CGATCCAAAC CACCACATAA CCAAATGATT 660 

GGTTGATTAA ATGAATTTAA GGCAAACTGT GTTGCTAGCG TGTTTGTTGC TTTGGAATCA 720 

TTATAATATT TATTAGTTCT ATTAGTACCA ACATATTGCA ATCTATGCTC TATTCCTGAA 78 0 

AATGTAGTTA AACTATCAAT AATTGCtTTA ATAGGTACAC CAGCanAATA CAAGCAAGCA 84 0 

CAGCTGCTAA TATATTTcTA AATTATGTTC ACCAGGCAAT ACTAGAtCTT CAGTGTTAAT 900 

AATaCfiAACA CCTTTATaAA CGATAAAACC ATCTTtAATA TAAaTACCAT CArCTtCTTG 960 

TTGAGTTGAG AAATACAATG TCTTAGCTTT TAATTCTTCC G ACT CT AT CA CTTGTCTTTG 102 0 

ATGATAATTA CAAATCAAAT AATCCTCTTC CGTTTGATTT TTATATATTT GCTTTTTAGC 1080 

ATTTTGATAG TTTTCTAAAT TTTCATGGTA ATCTAGATGC GCCGAATAAA TGTTAGTAAT 1140 

TATAGCAATG TGTGGTTTAT ACTTTTCGAT TCCAAGTAAC TGGAATGACG ACAACTCTGT 1200 

AACTAAATAA TCTGTAGGCT TTACTTCTTG TGCTACTTTA GATGCAACAT AACCAATATT 1260 

GCCGGATAAT CTTCCAGTTA AGCGACTTTT TTTAAACATA TCTCCAATTA GAGAAGTAAC 1320 

(2) INFORMATION FOR SEQ ID NO : 81: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4280 base pairs 
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(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 
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SEQUENCE DESCRIPTION: 


SEQ ID NO: 


81: 






1 1 I At_ACCAA 


TCAAAAAATC 


GAACTGATAT 


AAATAAGTAC 


AAAGCTTATC 


TATCAATCCG 


60 


ATTT AG TT AT 


AAAACAAAAA 


AAGCCACAGT 


AATGTGGCTT 


TTTGTTATAT 


TCAGTATCAA 


120 


AATGOTATCA 


ATAGCCATTT 


X ^.UMnnv iVn 


AGAATGGCTT 


AACAACGCGG 


TTTAAAGCTA 


180 


TCCAATACTA 


^>wX l^Utl X X 




TAAACGGTTC 


ATTTCGACCG 


CGTATTCCAT 


240 


TGGAAGTTCT 


T^^*T V I • R Jl R 

X X luiilAAlij 


Ca x X CoATGAA 


TCCCATAACA 


ATCATTTCTG 


TCGCTTCTTC 


300 


TTCAGAAATA 


CCACGACTCA 


TTAGATAGAA 


TAATTGTTCT 


TCAGAAACTT 


TTGAAACCTT 


360 


GGCTTCATGT 


«TV»rr» m j\ t|i/ » « mm 

TCTAATGATA 


TTTGATCGTT 


GAATACTTCG 


TTATATGGAA 


TTGTATCTGA 


420 


TGTTGATTCG 


TTATCTAAGA 


TTAATGTATC 


ACATTCAATA 


TTTGAACGAQ 


CACCTTTTGC 


480 


TTTACGTCCA 


AAATGAACAA 


TACCGCGATA 


AATAACTTTA 


CCACCATTTT 


TAGAAATAGA 


540 


TTTAGAAACA 


ATTGTAGAAG 


ATGTATTAGG 


TGCTTTATGA 


ATCATTTTAG 


CACCGGCATC 


600 


TTGAACTTGT 


CCITTACCAG 


CAAATGCAAT 


AGATAATGTA 


CTACCTTTTG 


CACCTTCACC 


660 


TAAAAGAACA 


CAGTTTGGAT 


ATTTCATCGT 


TAACTTAGAA 


CCTAAGTTAC 


CATCTACCCA 


720 


TTCCATATTT 


CCGTTTTCAT 


AAACAAAAGT 


ACGTTTTGTA 


ACTAAATTGT 


ATACATTGTT 


780 


CGCCCAGTTT 


TGAATCGTAG 


TATAACGAAC 


GTGCGCATCT 


TTATGCACAA 


TGATTTCCAC 


840 


AACAGCAGAG 


TGTAAAGAAC 


TAGTTGTATA 


AACTGGTGCA 


GTACAACCTT 


CTACGTAATG 


900 


TACAGAAGCA 


CCTTCATCAG 


CAATGATTAA 


TGTAOGTTCA 


AATTGACCCA 


TGTTCTCAGA 


960 


GTTAATACGG 


AAATAAGCTT 


GTAGTGGCGT 


ATCTAGTTTG 


ATATTTTTAG 


GTACATAAAT 


1020 


GAAGGAACCA 


CCTGACCATA 


CTGCTGAGTT 


TAACGCCGCA 


AATTTGTTAT 


CTGCTGCAGG 


1080 


TACTACAGAA 


GCAAAGTATT 


TTTTGAATAA 


TTCTTCATTT 


TCTTGTAAAG 


CACTATCTGT 


1140 


ATCTTTAAAG 


ATAATACCTT 


TTTCTTCAAG 


TTCTTTTTCC 


ATATTATGGT 


AAACAACTTC 


1200 


AGATTCATAT 


TGAGCAGAAA 


CACCAGCTAA ATATTTTTGT 


TCAGCTTCAG 


GAATTCCTAA 


1260 


TTTATCGAAA GTTCTTTTAA 


TTTCTTCTGG 


CACTTCATCC 


CATGAACGTT 


CAGCTTGTTC 


1320 


TGAAGGCTTT 


ACATAGTAAG 


TAATGTCATC 


GAAATTCAAT 


TCTGATAAGT 


CGCCACCCCA 


1380 


TTGAGGCATT 


GGCATTTTAT 


AAAACAATTT 


TAATGATTTA 


AGACGGAAAT 


CTAACATCCA 


1440 


TTCCGG CTCA 


TTTTTCATGT 


TAGAAATTTC 


TCTAACGATA 


TTCTCAGTTA 


AACCACGTTC 


1500 


TGATCTGAAA 


ATGGACACAT 


CATCGTCGTG 


GAATCCATAT 


TTATAATCCC 


CAACATCAGG 


1560 
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TTTAATTCAT 


GATGTAAACC 


ATATTATAAC 


AATGACATGA 


CATCTTATAA 


AAATTTTTAT 


1680 




ACTTTTATAT 


GTCTAATATC 


AAAATTATCT 


ATGATTAACA 


GCATTCTATT 


CTTCTTCAGT 


1740 


5 


CGTACCTTCT 


GCTTTACCTT 


CTTTAGCAAC 


AGTACCTTTT 


TCCAATGCTT 


TCCAAGCTAA 


1800 




TGTGGCACAT 


TTAATACGAG 


CTGGGAATTG 


AGATACACCT 


TGCAATGCTT 


CAATATCTCC 


1860 


10 


CATTTCTTCT 


GTAATCACAT 


AGTCTTCACC 


AAGCATCATT 


TTCGTAAATT 


CTTGGCTCAT 


1920 


TTGCATTGCT 


TCTC CAAGTG 


AATGACCTTT 


AACAGCTTGT 


GTCATCATCG 


ATGCACTTGC 


1980 




CATTGAAATC 


GAACAACCTT 


CACCTTCAAA 


CTTAGCATCT 


TTTATAATGC 


CGTCTTCTAT 


2040 


IS 


ATCAAATGTT 


AGTCGTATAC 


GGTCACCGCA 


TGTCGGGTTA 


TTCATATCTA 


CTGTCATAGA 


2100 




CCCGTTATCT 


AATACACCTT 


TATTTCTAGG 


ATTTTTATAA 


TOATCCATAA 


TOACAOATCT 


2160 




ATATAATTGA 


TCTAGATTAT 


TAAAATTCAT 


AAGAGAAAAA 


CTCCTTCGTT 


TGTTTCAAGG 


2220 


20 


CATTTATTAA 


CTGATCAACG 


TCTTCTTTCG 


TGTTGTATAT 


ATAAAAACTC 


GCTCTAGCTG 


2280 




TTGAAGACAC 


ATTT AAC CAT 


TTCATTAACG 


GTTGCGCACA 


ATGATGCCCA 


GCTCTAACCG 


2340 




CTACACCTTC 


TGTATCTACG 


GCTGTAGCAA 


CATCGTGTGG 


ATGTACATCT 


TGTAAATTAA 


2400 


25 


ACGTTATTAC 


ACCTGCACGA 


CGATCCTTTG 


GCGGGCCATA 


AATTTCAATT 


CCTTCAATTG 


2460 




CAGACATTTG 


CTCATAAGCA 


TAT AT CGTTA 


ATT CTTGTT C 


ATATTTATGA 


ATTGCATCAA 


2520 




AACCTATGCG 


TTCTAAATAG 


CGAATAGCTT 


CTGCAAGCCC 


AATTGCTTGA 


GCAATTAATG 


2580 


30 


GAGTACCCGC 


CTCAAATTTA 


GTAGGTAAAT 


CAGCCCATGT 


TGCATCATAC 


TTACTTACAA 


2640 




AATCAAT CAT 


GTCGCCACCG 


AACTCAATCG 


GTT CCATTTT 


TTGTAGTAAC 


TCACGTTTAC 


2700 


35 


CAAATAATAC 


GCCAATAC CT 


GTTGGTCCAA 


GCATTTTATG 


ACCACTAAAA 


CTATAAAAAT 


2760 


CAGCATTCAT 


TTCTTGCATA 


TCAAGTTTCA 


TATGTGGTGC 


TGctTGCGCC 


CCATCAACAC 


2820 




TGATSATTGC 


ACCATGTTGA 


TGAGCTATTT 


CTGCAATGGT 


TTTAACATCA 


TTAATTGTAC 


2880 


40 


CGAGCACATT 


AGATATATGT 


GCAATAGCAA 


CGATCTTTGT 


TTTATCATTA 


ATCGTTTGCT 


2940 




TAATATCCTC 


GATGTTTAAT 


TCACCGTCAG 


CTGTCATTGG 


TATAAATTTC 


AATGTCGCAT 


3000 




TTTTACGCTT 


TGCTAACTGT 


TGCCAAGGAA 


CAATATTGGC 


ATGATGTTCC 


ATTTCAGTGA 


3060 


45 


CAACAATTTC 


ATCGCCCTCT 


TCAACATTTG 


CATCACCATA 


GCTATGTGCT 


ACAAGGTTAA 


3120 




TCGACGCAGT 


TGTTCCGCGT 


GTAAAAATGA 


TTTCTTCAAA 


ATACTTCGCA 


TTAATAAAAC 


3180 




GACGAACGGT 


TTCACGGGCA 


TTTTCATAAC 


CATCAGTTGC 


CAATGATCCT 


AATGTATGAA 


3240 


50 


CACCACGATG 


AACGTTTGAA 


TTATAACGCT 


TGTAGTAATC 


TTCTAAAACA 


TTTAACACTT 


3300 




GCACAGGCGT 


TTGACTTGTC 


GCTGTTGAAT 


CAAGATATGC 


TAAACGTTTG 


CCATTGACTT 


3360 
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CTTCATTCAC GACCTTTCTT AAATAAAAAT CCTAATCATT TAAATACTGA CGTTGTATTA 3480 

GTCTTATACC AATATCGACA GTCTATATCT ATTACAAACT TTTATTTTCA AAATATTATT 3540 

5 

TAGAAACTTT GCGTTCAATT ACTTCTCTCA ATTGACGTTT AACGTCTTCG ATAGGTAATT 3600 

CACGTACTAC TGGATCTAAG AAACCATGTA TAACAAGACG TTCCGCTTCT CTTTGAGAAA 3660 

TACCACGACT CATTAAATAG TAAAGTTGAT CTGGATCAAC ACGACCTACT GATGCAGCAT 3720 

10 

GACCAGCTTG TACATCATCT TCATCAATTA ATAAAATAGG ATTCGCGTCA CCACGAGCAT 3780 
GTTCAGATAA CATTAATACA CGTGATTCCT GATTAGCAAT TGATTTAGTT CCACCATGCT 3840 

15 TAATGTAGCC GAT AC CATT A AATACAGACG ATGCATGTTC TTTCATAACA CCATGTTTAA 3 900 

GGATATAACC ATCTGTTTCT TTACCATATT GTACGATTTT AGATGTTAGA TTAATTTTTT 3960 
GTTCGCCTGT ACCTACAACT ACTGATTTAA GTGAACTTGT TGAACGATCA CCAAATAAAT 4020 

20 TTGTTGTATT ATCAATAATT TGGCTACCCT CATTCATTAA ACCTAGTGCC CAATTAATTG 4080 

AGGCATCCGC TTCAGTAATA CCACGTCGAA TGATATGACC TGTAAAGCCT TTATCCATAT 4140 
AGTCCACTGA GCCATATGTG ATATTTGAAT TTGCACCAGC AATCACTTCA GAAATAATAT 4200 

25 TtAATTGATT TCCTTCACCA GATGCATTTG mTAAGTAATT TTCAACATAT GTGACTTCGG 4260 

CGCTTTCTTC AGTAACGATG 4280 
(2) INFORMATION FOR SEQ ID NO: 82: 

30 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 15598 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

35 



*- (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 82: 



40 



TCnGACTCGA 


ACGGTGmAAC 


TAttCCGTTG 


TaATTCCgGA GgAAsCAAGG TATGCCCATC 


60 


TGCaAAGAAA 


gaATGsAATG 


AACTTTTTGG 


AAATGTAGAA 


GTGGTAAATA 


AAGATAAAGG 


120 


ATATTACATT 


CTGAGAAGTA 


TAAAAGCTTG 


AAATGAAATG 


GATATTCTGT 


TATAGTTATA 


180 


TAATGTAAAA ATTTATGTTC 


AATAAGTGTG 


TACTTTTACG 


TTAAATAGAT 


AAGTTAATTA 


240 


AGAATAAATA 


TAGAATCGAA 


AATGGTGTCA 


TCATTAGTGT 


TGCCGTTTTC 


TTTTTGTCTT 


300 


TTTATTAATA 


TGCTTATGGT 


ATTTAGCTAA 


AAGCGGATCA 


CATAATTTTT 


GAGGGGTGAA 


360 


TCTGTTTGGC 


AGGTCAAGTT 


GTCCAATATG 


GAAGACATCG 


TAAACGTAGA 


AACTACG CG A 


420 


GAATTTCAGA 


AGTATTAGAA 


TTACCAAACT 


TAATAGAAAT 


TCAAACTAAA 


TCTTACGAGT 


480 
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CTGGTAATTT 


' GTCATTAGAG 


TTTGTGGATT 


ACCGTTTAGG 


AGAACCAAAA 


, TATGATTTAG 


600 




AAGAATCTAA 


. AAACCGTGAC 


GCTACTTATG 


CTGCACCTCT 


TCGTGTAAAA 


GTGCGTCTAA 


660 


5 


TCATTAAAGA 


AACAGGAGAA 


GTTAAAGAAC 


AAGAAGTCTT 


TATGGGTGAT 


TTCCCATTAA 


720 




TGACTGATAC 


AGGTACGTTC 


GTTATCAATG 


GTGCAGAACG 


TGTAATCGTA 


TCTCAATTAG 


780 


10 


TTCGTTCACC 


ATCCGTTTAT 


TTCAATQAAA AAATCOACAA AAATGGTCGT 


GAAAACTATG 


840 


ATGCAACAAT 


TATTCCAAAC 


CGTGGTGCAT 


GGTTAGAATA 


TGAAACAGAT 


GCTAAAGATG 


900 




TTGTATACGT 


ACGTATTGAT 


AGAACACGTA 


AACTACCATT 


AACAGTATTG 


TTACGTGCAT 


960 


■fC 


TAGGTTTCTC 


AAGCGACCAA GAAATTGTTG 


ACCTTTTAGG 


TGACAATGAA 


TATTTACGTA 


1020 




ATACTTTAGA 


GAAAGACGGC 


ACTGAAAACA 


CTGAACAAGC 


GTTATTAGAA 


ATCTATGAAC 


1080 




GTTTACGTCC 


AGGTGAACCA 


CCAACTGTTG 


AAAATGCTAA 


AAGTCTATTG 


TATTCACGTT 


1140 


20 


TCTTTGATCC 


AAAACGCTAT 


GACTTAGCAA 


GCGTGGGTCG 


TTATAAAACA 


AACAAAAAAT 


1200 




TACATTTAAA 


ACATCGTTTA 


TTTAATCAAA 


AATTAGCTGA 


GCCAATTGTA 


AATACTGAAA 


1260 




CTGGTGAAAT 


TGTAGTTGAA 


GAAGGTACAG 


TGCTTGATCG 


TCGTAAAATC 


GACGAAATCA 


1320 


25 


TGGATGTACT 


TGAATCAAAT 


GCAAACAGCG 


AAGTGTTTGA 


ATTGCATGGT 


AGCGTTATAG 


1380 




ACGAGCCAGT 


AGAAATTCAA 


TCAATTAAAG 


TATATGTTCC 


TAACGATGAT 


GAAGGTCGTA 


1440 




CGACAACTGT 


AATTGGTAAT 


GCTTTCCCTG 


ACTCAGAAGT 


TAAATGCATT 


ACACCAGCAG 


1500 


30 


ATATCATTGC 


TTCAATGAGT 


TACTTCTTTA 


ACTTATTAAG 


CGGTATTGGA 


TATACAGATG 


1560 




ATATTGACCA 


TTTAGGTAAC 


CGTCGTTTAC 


GTTCTGTAGG 


TGAATTACTA 


CAAAACCAAT 


1620 


35 


TCCGTATCGG 


TTTATCAAGA 


ATGGAAAGAG 


TTGTACGTGA 


AAGAATGTCA 


ATTCAAGATA 


1680 


CTGAGTCTAT 


CACACCTCAA 


CAATTAATTA 


ATATTCGACC 


TGTTATTGCA 


TCTATTAAAG 


1740 




AATtCTTTGG 


TAGCTCTCAA 


TTATCACAAT 


TCATGGACCA 


AGCAAACCCA 


TTAGCTGAGT 


1800 


AO 


TAACGCATAA 


ACGTCGTCTA 


TCAGCATTAG 


GACCTGGTGG 


TTTAACACGT 


GAACGTGCTC 


1860 


AAATGGAAGT 


ACGTGACGTT 


CACTACTCTC 


ACTATGGCCG 


TATGTGTCCA 


ATTGAAACAC 


1920 




CTGAGGGACC 


AAACATTGGA 


TTGATTAACT 


CATTATCAAG 


TTATGCACGT 


GTAAATGAAT 


1980 


45 


TCGGCTTTAT 


TGAAACACCA 


TATCGTAAAG 


TTGATTTAGA 


TACACATGCT 


ATCACTGATC 


2040 




AAATTGACTA 


TTTAACAGCT 


GACGAAGAAG 


ATAGCTATGT 


TGTAGCACAA 


GCAAACTCTA 


2100 




AATTAGATGA 


AAATGGTCGT 


TTCATGGATG 


ATGAAGTTGT 


ATGTCGTTTC 


CGTGGTAACA 


2160 


60 


ATACAGTTAT 


GGCTAAAGAA 


AAAATGGATT 


ATATGGATGT 


ATCGCCGAAG 


CAAGTTGTTT 


2220 




CAGCAGCGAC AgcATGTATT 


CCATTCTTAG 


AAAATGATGA 


CTCAAACCGT 


GCATTGATGG 


2280 
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CAGGTATGGA ACACGTTGCA GCACGTGATT CTOGTGCGOC TATTACAGCT AAGCACAGAG 


2400 




GTCGTGTTGA ACATGTTGAA 


TCTAATGAAA 


TTCTTGTTCG 


TCGTCTAGTT 


GAAGAGAACX3 


2460 


5 


GCGTTGAGCA 


TGAAGGTGAA 


TTAGATCGCT 


ATCCATTAOC 


TAAATTTAAA 


CGTTCAAACT 


2520 




CAGGTACATG 


TTACAACCAA 


CGTCCAATCG 


TTGCAGTTGG 


AGATGTTGTT 


GAGTATAACG 


2560 


10 


AGATTTTAGC 


AGATGGACCA 


TCTATGGAAT 


TAGGAGAAAT 


GGCATTAGGT 


AGAAACGTAG 


2640 


TAGTTGGTTT CATGACTTGG GACGGTTACA ACTATGAGGA TGCCGTTATC 


ATGAGTGAAA 


2700 




GACTTGTGAA AGATGACGTG 


TATACTTCTA 


TTCATATTGA AGAGTATGAA 


TCAGAAGCAC 


2760 


IS 


GTGATACTAA 


GTTAGGACCT 


GAAGAAATCA 


CAAGAGATAT 


TCCTAATGTT 


TCTGAAAGTG 


2820 




CACTTAAGAA 


CTTAGACGAT 


CGTGGTATCG 


TTTATATTGG 


TGCAGAAGTA 


AAAGATGGAG 


2880 




ATATTTTAGT 


TGGTAAAGTA ACGCCTAAAG 


GTGTAACTGA GTTAACTGCC 


GAAGAAAGAT 


2940 


20 


TGTTACATGC 


AATCTTTGGT 


GAAAAAGCAC 


GTGAAGTTAG 


AGATACTTCA 


TTACGTGTAC 


3000 




CTCACGGCGC 


TGGCGGTATC 


GTTCTTGATG 


TAAAAGTATT 


CAATCGTGAA 


GAAGGCGACG 


3060 




ATACATTATC 


ACCTGGTGTA AACCAATTAG 


TACGTGTATA 


TATCGTTCAA 


AAACGTAAAA 


3120 


25 


TTCATGTTGG 


TGATAAGATG 


TGTGGTCGAC 


ATGGTAACAA 


AGGTGTCATT 


TCTAAGATTG 


3180 




TTCCTGAAGA 


AGATATGCCT 


TACTTACCAG 


ATGGACGTCC 


GATCGATATC 


ATGTTAAATC 


3240 




CTCTTGGTGT 


ACCATCTCGT 


ATGAACATOG 


GACAAGTATT 


AGAGCTACAC 


TTAGGTATGG 


3300 


CTGCTAAAAA 


TCTTGGTATT 


CACGTTGCAT 


CACCAGTATT 


TGACGGTGCA ' AACGATG ACG 


3360 




ATGTATGGTC 


AACAATTGAA 


GAAGCTGGTA 


TGGCTCGTGA 


TGGTAAAACT 


GTACTTTATG 


3420 


35 


ATGGACGTAC 


AGGTGAACCA 


TTCGATAACC 


GTATTTCAGT 


AGGTGTAATG 


TACATGTTGA 


3480 


AACTTGCGCA 


CATGGTTGAT GATAAATTAC 


ATGCGCGTTC 


AACAGGACCA TATTCACTTG 


3540 




t TACACAACA 


ACCACTTGGC 


GGTAAAGCGC 


AATTCGGTGG 


ACAACGTTTT 


GGTGAGATGG 


3600 


40 


AGGTATGGGC 


ACTTGAAGCA 


TATGGTGCTG 


CATACACATT 


ACAAGAAATC 


TTAACTTACA 


3660 




AATCCGATGA 


TACAGTAGGA 


CGTGTGAAAA 


CATACGAGGC 


TATTGTTAAA 


GGTGAAAACA 


3720 




TCTCTAGACC 


AAGTGTTCCA 


GAATCATTCC 


GAGTATTGAT 


GAAAGAATTA 


CAAAGTTTAG 


3780 


45 


GTTTAGATGT 


AAAAGTTATG 


GATGAGCAAG 


ATAATGAAAT 


CGAAATGACA 


GACGTTGATG 


3840 




ACGATGATGT 


TGTAGAACGC 


AAAGTAGATT 


TACAACAAAA 


TGATGCTCCT 


GAAACACAAA 


3900 




AAGAAGTTAC 


TGATTAATAC 


GCAATTTACA 


AAACAGGCAA 


AAAGATACTA 


AGCTGAATTT 


3960 


SO 


TATTGATGAT 


TCAGTTTAGT 


ACTTTAAGCC 


ATTTTAAATA 


AATGCAAATC 


AATCAAATAG 


4020 




CACAGCTAAT 


CTAAATTGAA 


GGAGGTAGGC 


TCCTTGATTG 


ATGTAAATAA 


TTTCCATTAT 


4080 
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AAACCTGAAA CAATCAACTA CCGTACATTA AAACCTGAAA AAGATGGTCT ATTCTGTGAA 4200 

AGAATTTTCG GACCTACAAA AGACTGGGAA TGTAGTTGTG GTAAATACAA ACGTGTTCGC 4260 

TACAAAGGCA TGGTCTGTGA CAGATGTGGA GTTGAAGTAA CTAAATCTAA AGTACGTCGT 4320 

GAAAGAATGG GTCACATTGA ACTTGCTGCT CCAGTTTCTC ACATTTGGTA TTTCAAAGGT 4380 

ATACCAAGTC GTATGGGATT ATTACTTGAC ATGTCACCAA GAGCATTAGA AGAAGTTATT 444 0 

TACTTTGCTT CTTATGTTGT TGTAGATCCA GGTCCAACTG GTTTAGAAAA GAAAACTTTA 4500 

TTATCTGAAG CTGAATTCAG AGATTATTAT GATAAATACC CAGGTGAATT CGTTGCAAAA 4560 

ATGGGTGCAG AAGGTATTAA AGATTTACTT GAAGAGATTG ATCTTGACGA AGAACTTAAA 4620 

TTGTTACGCG ATGAGTTGGA ATCAGCTACT GGTCAAAGAC TTACTCGTGC AATTAAACGT 4680 

TTAGAAGTTG TTGAATCATT CCGTAATTCA GGTAACAAAC CTTCATGGAT GATTTTAGAT 4740 

20 GTACTTCCAA TCATCCCACC AGAAATTCGT CCAATGGTTC AATTAGATGG TGGACGATTT 4 800 

GCAACAAGTG ACTTAAACGA CTTATACCGT CGTGTAATTA ATCGAAATAA TCGTTTGAAA 4 860 

CGTTTATTAG ATTTAGGTGC ACCTGGXATC ATCGTTCAAA ACGAAAAACG TATGTTACAA 4920 

25 GAAGCCGTTG ACGCTTTAAT TGATAATGGT CGTCGTGGTC GTCCAGTTAC TGGCCCAGGT 4 9 80 

AACCGTCCAT TAAAATCTTT ATCTCATATG TTAAAAGGTA AACAAGGTCG TTTCCGTCAA 5040 

AACTTACTTG GTAAACGTGT TGACTATTCA GGACGTTCAG TTATTGCAGT AGGTCCAAGC 5100 

30 

TTGAAAATGT ACCAATGTGG TTTACCAAAA GAAATGGCAC TTGAACTATT TAAACCATTC , 5160 

GTAATGAAAG AATTAGTTCA ACGTGAAATT GCAACTAACA TTAAAAATGC GAAGAGTAAA 5220 

ATCGAACGTA TGGATGATGA AGTTTGGGAC GTATTGGAAG AAGTAATTAG AGAACATCCT 52 8 0 

35 

G T ATT ACTT A ACCGTGCACC AACACTTCAT AGACTTGGTA TTCAAGCATT TGAACCAACT 534 0 

TTAGTTGAAG GTCGTGCGAT TCGTCTACAT CCACTTGTAA CAACAGCTTA TAACGCTGAC 54 00 

TTTGACGGTG ACCAAATGGC GGTTCACGTT CCTTTATCAA AAGAGGCACA AGCTGAAGCA 54 60 

40 

AGAATGTTGA TGTTAGCAGC ACAAAACATC TTGAACCCTA AAGATGGTAA ACCTGTAGTT 5520 

ACACCATCAC AAGATATGGT ACTTGGTAAC TATTACCTTA CTTTAGAAAG AAAAGATGCA 5580 

45 GTAAATACAG GCGCAATCTT TAATAATACA AATGAAGTAT T AAAAG CAT A TGCAAATGGC 564 0 

TTTGTACATT TACACACTAG AATTGGTGTA CATGCAAGTT CGTTCAATAA TCCAACATTT 57 00 

ACTGAAGAAC AAAACAAAAA GATTCTTGCT ACGTCAGTAG GTAAAATTAT ATTCAATGAA 5760 

60 ATCATTCCAG ATTCATTTGC TTATATTAAT GAACCTACGC AAGAAAACTT AGAAAGAAAG 5820 

ACACCAAACA G AT ATTT CAT CGATCCTACA ACTTTAGGTG AAGGTGGATT AAAAGAATAC 5880 
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35 



40 
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GAAGTATTCA 
TTAGGATTCA 
TTACCTGATA 
CAATTCAACC 
ACAGATGCAA 
ATCTTCATGA 
GGTATGCGTG 
TCATTCCGTG 
GGTCTTGCCG 
GACGTGGCAC 
GTTTCTGATA 
CGTTATTCTA 
GAATTAATTA 
ATTCGCTCAG 
AACCTTGCTA 
TCTATCGGTG 
GGTAGCGATA 
AAAGGTCAAG 
GATAGACAAC 
GGTACTTCAA 
GAAGGTTCTA 
TACTTATTAA 
CACGTTGAGG 
ACGAAGTTAT 
GCATTTAAAC 
GCATCACTTG 
CTTACAGATG 
ATTATTGGTA 
GAAAAAACAG 



ACAGATTTAG 
AATTCTCATC 
AGCAACAAAT 
GTGGTTTAAT 
AAGATCAAAT 
TGAGTGATTC 
GATTGATGGC 
AAGGTTTAAC 
ATACAGCACT 
AAGATGTTAT 
TTAAAGAAGG 
AAGAAACAAT 
CACCTGAAAT 
CATTTACTTG 
CTGGTGAAAA 
AACCAGGTAC 
TCACACAAGG 
CGGTAATTAC 
AAGAAATTGT 
GAATTATTGT 
TTGAACCTAA 
AAGAAGTACA 
TTATGGTTCG 
TACCAGGTTC 
ACCGTAAGCG 
AAACAGAAAG 
CAGCAATTAA 
AGTTAATTCC 
CTAAACCAGT 



CATCACTGAT 
TAAAGCTGGT 
ACTTGATGAG 
CACTGAAGAA 
TCAAGGTGAA 
AGGTGCCCGT 
CGCACCATCT 
AGTACTTGAA 
TAAAACAGCT 
TGTTCGTGAA 
TACAGAAATG 
TCGTCATCCT 
TGCTAAGAAA 
TAACGCACGA 
AGTTGAAGTT 
ACAGCTTACA 
TCTTCCTCGT 
GGAAATCGAA 
TGTTAAAGGT 
AGAAATCGGT 
GAATTACTTA 
AAAAGTTTAC 
ACAAATGTTA 
ATTAGTTGAT 
TCCTGCAACA 
TTTCTTATCT 
AGGTAAGCGT 
AGCTGGTACT 
TGCAGAAGTT 



ACATCAATGA 
ATTACAGTAG 
CATGAAAAAT 
GAAAGATATA 
TTGATGCAAT 
GGTAACGCAT 
GGTAAGATTA 
TACTTCATCT 
GACTCAGGAT 
GAAGACTGTG 
ATTGAACCAT 
GAAACTGATG 
ATTACAGATG 
CATGGTGTTT 
GGTGAAGCAG 
ATGCGTACAT 
ATTCAAGAGA 
GGTGTCGTAG 
GCTAATGAAA 
CAACCAGTTC 
TCTGTTGCTG 
CGTATGCAAG 
CGTAAAGTTA 
ATTCATAACT 
GCTAAACCAG 
GCAGCATCAT 
GATGACTTAT 
GGTATGAGAC 
GAATCTCAAA 



TGTTAGACCG 
GTGTTGCTGA 
TAGTCGACAG 
ATGCAGTTGT 
CACTTGATAA 
CTAACTTTAC 
TCGAATTACC 
CAACTCAOGO 
ATCTTACTCG 
GTACTGATAG 
TTATCGAACG 
AAATAATCAT 
CTGGTATTGA 
GTGAAAAATG 
TTGGTACAAT 
TCCATACAGG 
TTTTCGAAGC 
AAGATATTAA 
CAAGATCATA 
AACGTGGTGA 
GATTAAACGC 
GTGTAGAAAT 
GAATTATCGA 
TTACAGATGC 
TATTACTTGG 
TCCAAGAAAC 
TAGGTCTTAA 
GTTATAGCGA 
CTGAAGTAAC 



TATGAAAGAC 

TATCGTAGTA 

AATTACAAAA 

TGAAATTTGG 

AACTAACCCA 

ACAGTTAGCA 

AATCACATCT 

TGCACGTAAA 

TCGTCTTGTT 

AGGTTTATTA 

TATTGAAGGT 

TCGTCCTGAT 

ACAAATGTAT 

TTAOGGTAAA 

TGCAGCCCAA 

TGGGGTAGCA 

ACGTAACCcT 

ATTAGCAAAA 

CCTTGCTTCA 

AGTATTAACT 

GACTGAAAGC 

CGACGATAAA 

AGCAGGTGAT 

AAATAGAGAA 

TATTACTAAA 

AACAAGAGTT 

AGAAAACGTA 

CGTAAAATAC 

GGAATAACAA 



6000 

6060 

6120 

6180 

6240 

6300 

6360 

6420 

6480 

6540 

6600 

6660 

6720 

6780 

6840 

6900 

6960 

7020 

7080 

7140 

7200 

7260 

7320 

7380 

7440 

7500 

7560 

7620 

7680 
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ATGTTGACGA ATTCTCTTGT TCAATOTTAA 
GGAGGATAAA TTATTGTCTA AGGAAAAAGT 
5 TGGTCTTAAA GAAACGCTTA AAGCGTTAAA 

TGAAGACGTT GAAGTATATT TAATGACTCG 
ACCTGTATCT TTTTTCAAAA GCAAACATGC 

10 

TGCGACAATA GTAGCATTGA TTAAATGAGA 
TTTAACCTAA AAATGAACCA CCTGGATGTG 
ATCACATGCC AACTATTAAC CAATTAGTAC 

IS 

CAGATTCTCC AGCTTTAAAT AAAGGTTTCA 
ACTCACCACA AAAACGTGGT GTATGTACTC 

20 ACTCAGCGTT ACGTAAATAT GCACGTGTGC 

ACATCCCTGG TATCGGACAT AACTTACAAG 
GTGTAAAAGA CTTACCAGGT GTGCGTTACC 

25 GTGTTGACGG ACGTAGACAA GGTCGTTCAT 

AATTTAGTTT TTAATTAAAT CTTAAACTTA 
CATTATGCCT CGTAAAG GAT CAGTACCTAA 

30 CTCTAAGTTA GTAACTAAAT TAATTAACAA 

ACAAAGAATT CTTTATTCAG CATTCGACCT 
GAAGTATTCG AAGAAGCAAT CAACAACATT 

35 

GTAGGTGGTT CTAACTATCA AGTACCAGTA 
GGTTTACGTT GGTTAGTTAA CTATGCACGT 
TTAGCTAACG AAATTTTAGA TGCAGCAAAT 

40 

GACACTCACA AAATGGCTGA AGCAAACAAA 
AGCTTTTACC CTGAGTGTGT TCTATATTAA 

4S CATCGC CATA TCTATCGTAT TTATTCAGTA 

CTAGAGAATT TTCATTAGAA AAAACTCGTA 
GTAAAACGAC TACGACTGAA CGTATTCTTT 

SO AAa CACACG A AGGTGCTTCA CAAATGGACT 

CTATCACATC TGCTG CAACA ACAGCAGCTT 

55 



TATATTAAAG GTTGATGCAA GCAGAACTTT 7800 

tGCACGCTTT AACAAACAAC ATTTTGTAGT 7860 

GAAAGATCAA GTTACATCTT TGATTATTGC 7920 

CGTGTTAAGC CAAATCAATC AGAAAAATAT 7980 

TTTGGGTAAA CATGTAGGTA TTAACGTCAA 8040 

ATTAGTAAGT GTTTTACTTA CTAAATTTTA 8100 

TGGGATTAAA AAGTGAAGAG AGGAGGACAT 8160 

GTAAACCAAG ACAAAGCAAA ATCAAAAAAT 8220 

ACAGTAAAAA GAAAAAATTT ACTGACTTAA 8280 

GTGTAGGTAC AATGACACCT AAAAAACCTA 8340 

g T t TATCAAA CAACATCGAA ATTAACGCAT 8400 

AACACAGTGT TGTACTTGTA CGTGGTGGAC 8460 

ATATTGTACG TGGAGCACTT GATACTTCAG 8520 

TATACGGAAC TAAGAAACCT AAAAACTAAG 8580 

AAATATTTAA TATAAGGAAG GGAGGATTTA 8640 

AAGAGACGTA TTACCAGATC CAATTCATAA 8700 

AATTATGTTA GATGGTAAAC GTGGAACAGC 8760 

AGTTGAACAA CG CAGgtTCG TGATGCATTA 8 820 

ATGCCAGTAT TAGAAGTTAA AGCTCGTCGC 8880 

GAAGTTCGTC CAGAGCGTOG TACTACTTTA 8940 

CTTCGTGGTG AAAAAACGAT GGAAGATCGT 9000 

AATACAGGTG GTGCCGTTAA GAAACGTGAG 9060 

G CATTTG C TC ACTACCGTTG GTAAGATAAA 912 0 

TGAATTTTCA TTAAGCGTTC ATGCTTAGGG 9180 

ATATAAACTG GAAGGAGAAA AAATACATGG 9240 

ATATCGGTAT CATGGCTCAC ATTGATGCTG 9300 

ATTACACTGG CCGTATCCAC AArGknGGTG 9360 

GGATGGAGCA AGAACAAGAC CGTGGTATTA 9420 

GGGAAGGTCA CCGTGTAAAC ATTATCGATA 94 80 
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CAGTTACAGT 


ACTTGATGCA 


CAATCAGGTG 


TTGAACCTCA 


AACTGAAAGA 


GTTTGGGGTC 


9600 


AGGCTACAAC 


TTATGGTGTT 


CCACGTATCG 


TATTTGTAAA 


CAAAATGGAC 


AAATTAGGTG 


9660 


CTAACTTCGA ATACTCTGTA AGTACATTAC ATGATCGTTT ACAAgCTAAC GCTGCTCCAA 


. 9720 


TCCAATTACC 


AATTGGTGCG 


GAAGACGAAT 


TCGAAGf!AAT 


u\i iunw X Xn 


(TPTn 7i 7i 7a tc: 71 

vxx iwvinlwi 


9760 


AATGTTTCAA 


ATATACAAAT 


fl ATTT ^nftTIV 


f*TYZ 71 7A. BTTR 71 


71 fl li H TTtl A XL. 


TATT/TrY"" TA TA C 
Al Xt-l_i\jAAVj 


9840 


ACCACTTAGA 


TAGAGCTGAA 


wiHoL X Lu X v? 


\-XAv*Ux 




vjL-AGAAACTA 


9900 


GCGACGAATT 


AATGGAAAAA 


TATCTTGGTG 


AGGAAGAAAT 


TTCAGTTTCT 


GAATTAAAAG 


9960 


AAGCTATCCG 


CCAAGCTa C t 


ACTAACGTAG 


AATTCTACCC 


AGTACTTTGT 


GGTACAGCTT 


10020 


TCAAAAACAA 


AGGTGTTCAA 


TTAATGCTTG 


ACGCTGTAAT 


TGATTACTTA 


CCTTCACCAC 


10080 


TAGACGTTAA ACCAATTATT 


GGTCACCGTG 


CTAGCAACCC 


TGAAGAAGAA 


GTAATCGCGA 


10140 


AAGCAGACGA 


TTCAGCTGAA 


TTCGCTGCAT 


TAGCGTTCAA 


AGTTATGACT 


GACCCTTATG 


10200 


TTGGTAAATT 


AACATTCTTC 


CGTGTGTATT 


CAGGTACAAT 


GACATCTGGT 


TCATACGTTA 


10260 


AGAACTCTAC 


TAAAGGTAAA 


CGTGAACGTG 


TAGGTCGTTT 


ATTACAAATG 


CACGCTAACT 


10320 


CACGTCAAGA AATCGATACT 


GTATACTCTG 


GAGATATCGC 


TGCTGCGGTA 


GGT CTTAAAG 


103B0 


ATACAGGTAC 


TGGTGATACT 


TTATGTGGTG 


AGAAAAATGA 


CATTATCTTG 


GAATCAATGG 


10440 


AATTCCCAGA 


GCCAGTTATT 


CACTTATCAG 


TAGAGCCAAA 


ATCTAAAGCT 


GACCAAGATA 


10500 


AAATGACTCA 


AGCTTTAGTT 


AAATTACAAG 


AAGAAGACCC 


AACATTCCAT. GCACAGACTG 


10560 


ACGAAGAAAC 


TGGACAAGTT 


ATCATCGGTG 


GTATGGGTGA 


GCTTCACTTA 


GACATCTTAG 


10620 


TAGACCGTAT 


GAAGAAAGAA 


TTCAACGTTG 


AATGTAACGT 


AGGTGCTCCA ATCGTTTCAT 


10680 


ATCGTGAAAC 


ATTCAAATCA 


TCTTQCACAAG 


TTCAAGGTAA 


ATTCTCTCGT .' 


CAATCTGGTG 


10740 


GTCGTGGTCA ATACGGTGAT 


GTTCACATTG 


Aft 1 1 UAUILL 


AAACGAAACA 


GGCGCAGGTT 


loaoo 


TCGAATTCGA 


AAACGCTATC 


GTTGGTGGTG 


TAGTTCCTCG 


TGAATACATT 


CCATCAGTAG 


10860 


AAGCTGGTCT 


TAAAGATGCT 


ATGGAAAATG 


GTGTTTTAGC 


AGGTTATCCT 


TTAATTGATG 


10920 


TTAAAGCTAA 


ATTATATGAT 


GGTTCATACC 


ATGATGTCGA 


TTCATCTGAA 


ATGGCCTTCA 


10980 


AAATTGCTGC 


ATCATTAGCA 


CTTAAAGAAG 


CTGCTAAAAA 


ATGTGATCCT 


GTAATCTTAG 


11040 


AACCAATGAT 


GAAAGTAACT 


ATTGAAATGC 


CTGAAGAGTA 


CATGGGTGAT 


ATCATGGGTG 


11100 


ACGTAACATC 


TCGTCGTGGA 


CGTGTTGATG 


GTATGGAACC 


TCGTGGTAAT 


GCACAAGTTG 


11160 


TTAATGCTTA 


TGTACCACTT 


TCAGAAATGT 


TCGGTTATGC 


AACATCATTA 


CGTTCAAACA 


11220 


CTCAAGGTCG 


CGGTACTTAC 


ACTATGTACT 


TCGATCACtA 


TGCTGAAGTT 


CCaAAATCaA 


11280 
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GCCTAGGTTA AAATACAAGG TGAGCTTAAA TGTAAGCTAT CATCTTTATA GTTTGATTTT 11400 

TTGGGGTGAA TGCATTATAA AAGAATTGTA AAATTCTTTT TGCATCGCTA TAAATAATTT 11460 

CTCATGATGG TGAGAAACTA TCATGAGAGA TAAATTTAAA TATTATTTTT AATTAGAATA 11520 

GGAGAGATTT TATAATGGCA AAAGAAAAAT TCGATCGTTC TAAAGAACAT GCCAATATCG 11580 

GTACTATCGG TCACGTTGAC CATGGTAAAA CAACATTAAC AGCAGCAATC GCTACTGTAT 11640 

TAGCAAAAAA TGGTGACTCA GTTGCACAAT CATATGACAT GATTGACAAC GCTCCAGAAG 11700 

AAAAAGAACG TGGTATCACA ATCAATACTT CTCACATTGA GTACCAAACT GACAAACGTC 11760 

ACTACGCTCA CGTTGACTGC CCAGGACACG CTGACTACGT TAAAAACATG ATCACTGGTG 11820 

CTGCTCAAAT GGACGGCGGT ATCTTAGTAG TATCTGCTGC TGACGGTCCA ATGCCACAAA 11880 

CTCGTGAACA CATTCTTTTA TCACGTAAOG TTGGTGTACC AGCATTAGTA GTATTCTTAA 11940 

ACAAAGTTGA CATGGTTGAC GATGAAGAAT TATTAGAATT AGTAGAAATG GAAGTTCGTG 12000 

ACTTATTAAG CGAATATGAC TTCCCAGGTG ACGATGTACC TGTAATCGCT GGTTCAGCAT 12060 

TAAAAGCTTT AGAAGGCGAT GCTCAATACG AAGAAAAAAT CTTAGAATTA ATGGAAGCTG 12120 

TAGATACTTA CATTCCAACT CCAGAACGTG ATTCTGACAA ACCATTCATG ATGCCAGTTG 12 180 

AGGACGTATT CTCAATCACT GGTCGTGGTA CTGTTGCTAC AGGCCGTGTT GAACGTGGTC 1224 0 

AAATCAAAGT TGGTGAAGAA GTTGAAATCA TCGGTTTACA TGACACATCT AAAACAACTG 12300 

TTACAGGTGT TGAAATGTTC CGTAAATTAT TAGACTACGC TGAAGCTGGT GACAACATTG 1236 0 

GTGCATTATT ACGTGGTGTT GCTCGTGAAG ACGTACAAOG TGGTCAAGTA TTAGCTGCTC 1242 0 

CTGGTTCAAT TACAC CACAT ACTGAATTCA AAG CAGAAGT ATACGTATTA TCAAAAGACG 12480 

AAGGTGGACG TCACACTCCA TTCTTCTCAA ACTATCGTCC ACAATTCTAT TTCCGTACTA 1254 0 

CTGAGGTAAC TGGTGTTGTT CACTTACCAG AAGGTACTGA AATGGTAATG C CTGGTG ATA 126 00 

ACGTTGAAAT GACAGTAGAA TTAATCG CTC CAATCGCGAT TGAAGACGGT ACTCGTTTCT 12 660 

CAATCCGTGA AGGTGGACGT ACTGTAGGAT CAGGCGTTGT TACTGAAATC ATTAAATAAT 12720 

TTCTAATTTC TTAGATTTTA TATAAAAAGA AGATCCCTCA ATCGAGGGGt CTTTTTTTAA 12780 

TGTGTAAATT TTGTAATGGC TATTCGATTT AGAAGAACAA TAATTGATGA AAGACTGACT 12840 

AATAAAACTT ATAACTGATA ATACTGTTTA AATAAAATTG TTGAGTCTTG GACATTGTAA 12900 

AATGCTCCCT TCAAAGTTTT CATTTTTTCa ATGTCTACTT TGAAGGGAGC ATTTCATTAG 12 960 

TTTATGTCTC AG ATT CAT AT CTTTCAATTA ATTTAAATGC TTAATTTGTT TTAAATACTT 13020 

GCTCTAATTC TATGATTTTT AAAAATACAG CTACAGCGTA TTTTAATGAT TTTTCATCAA 13080 
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TCAGAAAGAA TGCACCTGGT CGTACTTTCA AATAATGTGA AAAATCTTCT CCAATCATCA 


13200 




TTAAATCTGA 


TTCATTAAAG CGTACATGTA AGTCATTTGT 


TGCTTCTTTA ATAACTTGAT 


13260 


5 


ATGCTTTCTC GTTATTATGG ACAGGCAAAT ACCCTTTAAT ATAATTCAAA TCATAGTTAA 


13320 




TATCATTTGC 


TATTGCTAAA CCTTGTAGAA 


GCTTATCCAT 


TTTGTCCATT 


ACATGATTCT 


13380 


10 


GTATATCTGA 


ATCGAAAGTT CTAACTGTAC 


CTTTACAAAA 


TGCTTGATCA 


GGAATAACGC 


13440 


TATCTGTGGT GCCTGCTTGA ATCATTCCAA ATGAAAGTAC AGCTTQTTTA ACTGGATCGA 


13500 




TCGTACGTGA 


aattattttt tgtgcactta 


AAATGAACTC 


TGCCATGATT 


ACTATTGGGT 


13560 


15 


CAATGGTTTC 


ATGAGGTTTG GCACCATGAC 


CACCACGACC 


TTTAAATGTG 


AOGCTAAATT 


13620 


CATCTGGAGA 


GGCCATGATT GCCCCCGCAC 


GTGAATGAAT 


AGTTCCAGTA 


GGATAACCAC 


13680 




TCCATAAATG 


TOTACCGTAA ATTCTATCTA 


CATTTTCCAG 


ACATCCAGCA 


TCTATCATTT 


13740 


20 


CTTGAGAACC 


ACCTGGCATG ATTTCTTCAC 


CGTACTGGAA 


TATTAATACA 


ACATTACCTT 


13800 




CTAATAAATG 


TTTATGTTCA TCTAAAATCT 


CTGCTACAGT 


AAGTAAAATT 


GCTGTATGAC 


13860 




CATCATGCCC 


ACACGCATGC ATACATCCTG 


GATTTTTAGA 


CTTATAAGGC 


ACATCGTTTA 


13920 


25 


ATTCCTCGAC 


AGGTAACGCA TCAAAGTCAG 


CTCTTAATGC 


AATGGTAGGT 


CCTGTGCCCA 


13980 




AGCCTTTAAA 


TGTGGCTTTG ATACCATTGC 


GGCCGATAGG 


AGTTTCAATA 


TCACAAGATA 


14040 




ACTGGCTTAA 


TTGGTTAACA ATATAATCAT 


GTGTTTGAAA 


TTCTTCAAAA 


GATAACTCAG 


14100 


30 


GATATTGGTG 


TAAATAACGT CTGAGTTGAA 


TTGTTTTATT 


TTCTTTATTA 


TTTGCTAGTT 


14160 




GGAACCAATC 


TAACACCCTT ATCACTACTT 


TCTAAAATAA 


TGTTTATAGT 


ATAACATTTT 


14220 




ATGAAATTAT 


CGTACTAAAT GATTGCTTTG 


AGATATTTTA 


TCTATGAATG 


ATAAGGCTTT 


14280 


35 


CAAGTTATGT 


AGAATTACTG TATGATAAAG 


GTATTACCAA 


ACAATACTTA 


AGGGGGATTA 


14340 




TATACTGTGG 


TTCAATCATT ACATGAGTTT 


TTAGAGGAAA 


ATATAAATTA 


TCTAAAAGAA 


14400 


40 


AATGGTTTGT 


ATAATGAAAT AGATACAATT 


GAAGGTGCAA 


ACGGACCAGA 


AATCAAAATC 


14460 


AATGGGAAAT 


CATAGATTAA CTTATCTTCA 


AATAATTATT 


TAGGACTAGC 


AACAAATGAA 


14520 




GATTTGAAAT 


CaGctGCAAA AGCAGCTATT 


GATACACATG 


GTGTAGGTGC 


AGGCGCTGTT 


14580 


45 


CGTACAATCA 


ATGGTACATT AGATTTACAC 


GACGAATTAG 


AAGAAACACT 


AGCAAAATTT 


1464 0 




AAAGGAACAG 


AAGCTGCAAT AGCTTATCAA 


TCAGGATTTA ATTGTAATAT 


GGCTGCTATT 


14700 




TCAGCTGTCA 


TGAATAAAAA TGATGCTATT 


TTATCAGATG 


AGCTTAATCA 


TGCATCAATT 


14760 


50 


ATTGATGGAT 


GTCGCTTATC TAAAGCTAAA 


ATTATTCGAG 


TTAAC CATTC 


AGACATGGAT 


14820 




GATTTACGTG 


CGAAAGCAAA AGAAGCAGTT 


GAATCAGGTC 


AATACAATAA 


AGTGATGTAT 


14880 
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ATTGCAGAAG AATTTGGTTT ATTAACTTAT GTTGACGACG CTCATGGTTC AGGTGTTATG 15000 

GGTAAAGGCG CTGGTACGGT TAAACATTTT GGTTTACAAG ATAAAATCOA TTTCCAAATA 15060 

GGTACGCTTT CTAAAGCAAT TGGTGTCGTT GGCGGTTATG TAG CAGGTAC AAAAGAGTTA 15120 

ATAGATTGGT TAAAAGCACA ATCACGACCA TTCTTATTCT CTACATCATT AGCACCTGGG 15180 

GATACCAAAG CAATAACTGA AGCAGTTAAA AAGTTAATGG ATTCAACTGA ATTACATGAT 15240 

AAATTATGGA ACAATGCACA ATATTTAAAA AATGGATTGT CAAAATTAGG ATATGATACA 153 00 

GGTGAGTCAG AAACTCCAAT TACACCAGTA ATTATTGGTG ATGAAAAAAC AACTCAAGAA 15360 

TTTAGTAAGC GTTTAAAAGA CGAAGGTGTC TATGTGAAAT CTATCGTTTT CCCAACAGTA 15420 

CCAAGAGGTA CAGGACGTGT AAGAAATATG CCTACAGCTG CACATACAAA AGACATGTTA 15480 

GATGAAGCAA TTGCGGCTTA TGAAAAAGTA GGAAAAGAAA TGAAGTTGAT TTAATATTTA 1554 0 

20 TTTATTCCCA CGGCAAATAT TGTCGTGGGC TTTTTTTAAT GTTTAGTTTA TTAACAGT 15598 

(2) INFORMATION FOR SEQ ID NO: 83: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 661 base pairs 
25 (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

30 

<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 83: 

AAGTAAATCA ACTTACTGGG ATAAGAATAA AGGCGATTAT AGTAACAAGT TGATTTTATT 60 

CGAAAAACAT TTTGAACCGG TTCTGGGTAT CAAGATGCAA CATAGTGGAG GTCATAG CTT 12 0 

35 

TGGCCACACG ATTATTACGA TTGAAAGTCA AGGAGATAAA GCAGTTCATA TGGGTGATAT 180 

ATTCCCAACT ACTG CACATA AAAATCCTCT ATGGGTAACG GCATATGATG ATTATCCTAT 24 0 

GCAATCGATT CGTGAAAAAG AACGCATGAT AC CATATTTT ATTCAGCAAC AATATTGGTT 300 

40 

CTTGTTTTAT CATGATGAAA ACTACTTTGC TGTAAAATAC AGCGATAATG GTGAAAACAT 360 

AGATGCATAT ATTTTACGTG AAACATTAGT TGATAATAAC TAAAATAAAG ATGTATTACT 420 

45 AAACAAATTT TCAAAAATAA AAAATTGAGC CACATCCAAT CTTACTAATT AGGGTGTGGC 480 

TCATTTTTAA GTTTTACgAT CCAAATCAAA T ATGG a T AAA ATTCgTATTA ACGCTCTACa 540 

ATGtTAATGA CTTCACCAGT ATATGCATCT GCATAAAAAT CATAATGAAT ATTTTGACCA 600 

SO TTTTTAATAG TTGTAATTCC ACCTTGATAA ACTAAACGGT ATTTATCAGT TTCAGGATGA 660 

A 661 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5738 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi> SEQUENCE DESCRIPTION: SEQ ID NO: 84: 

10 





GCAGACGGTA CAGCAGTTAA AGTCGCACCA AaACTGTAGT GAATcTAATC 


GGTGcATTCT 


€0 




TTTTAGGATT 


AGTTGTCGCG 


CTTATATATA 


TCTTCTTCAA AGTAATTTTC 


GATAAGCGAA 


120 


IS 


TTAAAGATGA AGAAGATGTA 


GAGAAAGAAT 


TAGGATTGCC 


TGTATTGGGT 


TCAATTCAAA 


180 




AATTTAATTA AGGATGGTTG 


CTACTTATGT 


CAAAAAAGGA 


AAATACGACA 


ACAACACTAT 


240 




TTGTATATGA 


AAAACCAAAA 


TCAACAATTA 


GTGAAAAGTT 


TCGAGGTATA 


CGTTCAAACA 


300 


20 


TCATGTTTTC 


AAAAGCAAAT 


GGTGAAGTAA 


AGCGCTTATT 


GGTTACTTCT 


GAAAAGCCTG 


360 




GTGCAGGTAA AAGTACAGTT 


GTATCGAATG 


TAGCGATTAC 


TTATGCACAA GCAGGCTATA 


420 




AGACATTAGT TATTGATGGC GATATGCGTA AgcCAACACA AAACTATATT TTTAATGAGC 


480 


25 


AAAATAATAA 


TGGACTATCA 


AGCTTAATCA 


TTGGTCGAAC 


GACTATGTCA 


GAAGCAATTA 


540 




CGTCGACAGA AATTGAAAAT 


TTAGATTTGC 


TAACAGCTGG 


CCCTGTACCT 


CCAAATCCAT 


600 




CTGAGTTAAT 


TGGGTCTGAA 


AGGTTCAAAG 


AATTAGTTGA 


TCTGTTTAAT 


AAACGTTACG 


660 


30 


ACATTATTAT 


TGTCGATACA 


CCGCCAGTTA 


ATACTGTGAC 


TGATGCACAA CTATATGCGC 


720 




GTGCTATTAA 


AGATAGTCTG 


TTAGTAATTG 


ATAGTGAAAA 


AAATGATAAr 


AATGAAGTTA 


780 


35 


AAAAAGCAAA 


AGCACTTATG 


GAAAAAGCAG 


GCAGTAACAT 


TCTAGGTGTC 


ATTTTGAACA 


640 


AGACAAAGGT 


CGATAAATCT 


TCTAGTTATT 


ATCACTATTA. 


TGGAGATGAA 


TAAGTATGAT 


900 




TGATATTCAT 


AAC CAT ATAT 


TGCCTAATAT 


CGATGACGGT 


CCGACAAATG 


AAACAGAGAT 


960 


40 


GATGGATCTT 


TTAAAACAAG 


CGACAACACA 


AGGTGTTACA 


GAAATCATTG 


TAACATCACA 


1020 


TCACTTACAT 


CCTCGATATA 


CCACACCTAT 


AGAAAAAGTG 


AAATCATGTT 


TAAACCATAT 


1080 




TGAAAGCTTA 


GAGGAAGTAC 


AAGCACTAAA 


TCTAAAGTTT 


TATTATGGTC 


AGGAAATAAG 


1140 


45 


AATTACCGAT 


CAAATCCTTA 


ATGATATTGA 


TCGAAAAGTT 


ATTAACGGTA 


TTAATGATTC 


1200 




ACGCTATTTA 


CTAATAGAAT 


TTCCATCAAA 


TGAAGTTCCA 


CACTATACTG 


ATCAATT AT t 


1260 




TTTCGAATtA 


CAGAGTAAAG 


GCTTTGTACC 


GATTATTGCA 


CATCCAGAGC 


GGAATAAAGC 


1320 


SO 


AATAAGTCAA 


AACCTTGACA 


TACTATACGA 


TTTAATTAAC 


AAAGGTGCTT 


TAAGTCAAGT 


1380 




GACAACGGcG 


TCATTAGCGG 


GTATTTCCGG 


TAAAAAAATT 


AGAAAATTAG 


CAATTCAAAT 


1440 
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GTTCTTAATG AAAGACTTAT TTAATGATAA GAAATTACGT GATTATTATG AAGATATQAA 1560 

CGGATTTATT AGTAATGCGA AGTTAGTTGT TGATGATAAA AAAATTCCTA AACGAATGCC 1620 

5 ACAACAAGAT TATAAACAGA AAAGATGGTT TGGGTTATAA ACAGCAAATG AGGGGTTTTA 1680 

TGGCACATTT ATCTGTGAAA TTGCGGCTTT TAATACTAGC ATTAATCGAT TCACTGATAG 1740 

TGACATTTTC AGTATTCGTA AGTTATTACA TTTTAGAACC GTATTTCAAA ACATATTCTG 1800 

10 

TCAAATTATT AATATTGGCA GCTATATCAC TATTCATATC GCATCATATT TCaGCATTTA I860 

TTTTTAATAT GTATCATCGA GCGTGGGAAT ATGCCAGTGT GAGTGAATTG ATTTTAATTG 1920 

TTAAAGCTGT GACGACATCT ATCGTTATTA CGATGGTGGT CGTGACAATT GTTACAGGCA 1980 

75 

ATAGACCGTT TTTTAGATTG TATTTAATTA CTTGGATGAT GCACTTOATT TTAATAGGTG 2040 

GCTCAAGGTT ATTTTGGCGT ATTTATCGGA AATACCTTGG AGGTAAGTCA TTTAATAAGA 2100 

20 AGCCAACTTT AGTTGTTGGT GCTGGTCAAG CAGGTTCAAT GCTGATTAGA CAAATGTTGA 2160 

AAAGTGACGA AATGAAACTT GAACCGGTAT TAG CAGTCGA TGATGACGAA CATAAACGCA 2220 

ATATCACAAT TACTGAGGGT GTAAAAGTCC AAGGTAAAAT TGCGGATATT CCAGAACTAG 2280 

25 TGAGGAAATA TAAGATTAAA AAAATCATCA TTGCAATTCC AACTATTGGT CAAGAGCGTT 2340 

TGAAAGAAAT TAATAATATT TGCCATATGG ATGGCGTTGA GTTATTGAAA ATGCCAAATA 2400 

TAGAAGACGT CATGTCTGGT GAGTTAGAAG TGAACCAACT TAAAAAAGTT GAAGTAGAAG 2460 

30 ATTTACTAGG CAGAGATCCT GTTGAATTAG ATATGGATAT GATATCAAAT GAATTGACGA 2 520 

ATAAAACTAT TTTAGTTACG GGTGCAGGTG GTT CAAT AGG ATCAGAAATT TGTAGACAAG 2 580 

TTTGTAATTT CTATCCAGAA CGTATTATTC TACTTGGCCA TGGTGAAAAC AGTATTTATT 2640 

35 

TAATCAATCG TGAATTGCGA AATCGCTTCG GwAAAAATGT TGATATCGTT C CTATT AT AG 2700 

CGGATGTGCA AAATAGAGCG CGTATGTTTG AAATTATGGA AACGTATAAA CCATACGCAG 2760 

TTTATCATGC AGCAGCACAC AAGCACGTGC CGTTAATGGA AG ACAACC CT GAAGAAGGAG 2820 

40 

TACGTAATAA TATTTTAGGT ACGAAAAATA CTGCTGAAGC TGCTAAAAAT GCAGAGGTAA 2880 

AGAAATTCGT TATGATTTCT ACGGATAAAG CCGTTAATCC GCCTAATGTC ATGGGAGCTT 2940 

CAAAGCGAAT TGCAGAAATG ATTATTCAAA GTTTAAATGA TGAAACGCAT CGAACAAATT 3000 

45 

TTGTTGCAGT GAGATTTGGT AATGTACTTG GATCGAGAGG ATCTGTGATT CCACTTTTCA 3060 

AAAGTCAAAT TGAAGAAGGT GGGCCAGTTA CTGTGACACA TCCTGAAATG ACACGTTACT 3120 

50 TTATGACAAT TCCTGAAGCT TCTAGACTAG TTTTGCAGGC AGGGGCATTA GCAGAAGGTG 3180 

GCGAAGTATT TGTGCTAGAT ATGGGAGAAC CAGTGAAAAT TGTAGATTTG GCACGTAATT 3 24 0 
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CCGGCGAAAA AATGTTTGAA OAGCTTATGA ATAAAGATGA GGTTCATCCT 


GAACAAGTAT 


3360 




TTGAAAAAAT 


TTATCGTGGC 


nnAVj InwuiL 


ATATGAAATG 


TAATGAAGTT 


GAAGCGATTA 


3420 


5 


TTCAAGACAT 


CGTCAATGAC 


TTTlfiTft a art 


AAAAAATTAT 


TAACTATGCC 


AATGGCAAAA 


3480 




AGGGAGATAA 


TTATGTTCGA 


Tfz & r* & & & a t*p 

lunwinnnl X 


TTATTAATTA 


CTGGGGGCAC 


AGGATCATTC 


3540 


10 


GGTAATGCTG 


TTATGAAACA 


ullll 1 ALiAT 


TCTAATATTA AAGAAATTCG 


TATTTTTTCA 


3600 


CGCGATGAGA AAAAACAAGA 


TGACATTCGA 


AAAAAATATA 


ATAATTCAAA 


ATTAAAGTTC 


3660 




TACATTGGTG 


ATGTGCGTGA 


TAGTCAAAGT 


GTAGAAACAG 


CAATGCGAGA 


TGTTGATTAC 


3720 


1S 


GTATTCCATG 


CAGCAGCTTT 


AAAACAAGTG 


CCGTCATGTG 


AATTCTTTCC 


AGTTGAGGCA 


3780 




GTGAAGACAA 


ATATTATTGG 


TACAGAAAAT 


GTCTTACAAA 


GTGCTATTCA 


TCAAAATGTT 


3840 




AAAAAAGTCA 


TATGTTTATC 


TACAGATAAG 


GCAGCGTATC 


CTATTAATGC 


TAGGGGTATT 


3900 


20 


TCAAAAGCAA 


TGATGGAAAA 


AGTATTCGTA 


GCCAAATCAA 


GAAATATTCG 


TAGTGAACAA 


3960 




ACGCTTATTT 


GTGGTACAAG 


ATACGGTAAT 


GTGATGGCTT 


CAAGAGGATC 


AGTAATACCT 


4020 




TTGTTTATCG 


ACAAAATCAA 


AGCTGGAGAA 


CCTTTAACGA 


TTACAGATCC 


TGATATGACA 


4060 


25 


AGATTTTTAA 


TGAGCTTAGA 


AGATGCGGTA 


GAACTAGTTG 


TTCATGCATT 


TAAGCATGCA 


4140 




GAGACAGGAG 


ATATTATGGT 


TCAAAAAGCA 


CCAAGCTCAA 


CGGTAGGGGA 


TCTTGCGACC 


4200 




GCATTATTAG 


AATTGTTTGA 


AGCTGATAAT 


GCAATTGAAA 


TCATTGGTAC 


GCGACATGGA 


4260 


30 


GAGAAAAAAG 


CAGAAACATT 


GTTGACGAGA 


GAAGAATACG 


CACAATGTGA 


AGATATGGGT 


4320 




GATTATTTTA 


GAGTGCCGGC 


AGACTCCAGA 


GATTTAAATT 


ATAGTAATTA 


TGTTGAAACC 


4380 


35 


GGTAACGAAA 


AGATTACGCA 


ATCTTATGAA 


TATAACTCCG 


ATAATACACA 


TATTTTAACG 


4440 


GTGGAAGAGA 


TAAAAGAAAA 


ACTTTTAACA 


CTAGAATATG 


TTAGAAACGA 


ATTGAATGAT 


4500 




TATAAAGCTT 


CAATGAGATA 


GGAGAGATTG 


ACGTTGAATA 


TTGTAATTAC 


AGGAGCAAAA 


4560 


40 


GGTTTTGTAG 


GAAAAAACTT 


GAAAGCAGAT 


TTAACTTCAA 


CGACAGATCA 


TCATATTTTC 


4620 




GAAGTACATC 


GACAAACTAA 


AGAGGAAGAA 


TTAGAGTCAG 


CATTGTTGAA AGCAGACTTT 


4680 




GTCGTGCATT 


TAGCGGGTGT 


TAATCGACCT 


GAACATGACA 


AAGAATTCAG 


CTTAGGAAAC 


4740 


45 


GTGAGTTATT 


TAG AT CATG T 


ACTTGATATA 


TTAACTAGAA 


ATACGAAAAA 


GCCAGCGATA 


4800 




TTATTATCGT 


CTTCAATACA 


AGCAACACAA 


GATAATCCTT 


ATGGTGAGAG 


TAAGTTGCAA 


4860 




GGGGAACAGC 


TATTAAGAGA 


GTATGCCGAA 


GAGTATGGCA 


ATACGGTTTA 


TATTTATCGC 


4920 


60 


TGGCCAAATT 


TATTCGGCAA 


GTGGTGTAAG 


CCGAATTATA 


ACTCAGTGAT 


AGCAACATTT 


4980 




TGTTACAAAA 


TTGCACGTAA 


CGAAGAGATT 


CAAGTTAATG 


ATCGGAATGT 


TGAACTAACG 


5040 
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5 



10 



15 



ATTGAAAATG 


GTGTACCTAC 


AGTACCAAAC 


GTATTTAAAG 


TGACATTGGG 


AGAAATTGTA 


5160 


GATTTATTAT 


ACAAGTTCAA 


ACAGTCACGT 


CTCGATCGAA 


CATTGCCGAA 


ATTAGATAAC 


5220 


TTGTTTGAAA 


AAGATTTGTA 


TAGTACGTAT 


TTAAGCTATC 


TACCTAGTAC 


aGACTTTAGT 


5280 


TAyCCCTTAC 


TTATGAATGT 


GGATGATAGG 


GGTTCTTTTA 


CAGAATTTAT 


AAAAACACCG 


5340 


GATCGTGGTC 


AAGTTTCTGT 


AAATATTTCT 


AAACCAGGTA 


TTACTAAAGG 


TAATCACTGG 


5400 


CATCATACTA 


AAAACGAAAA 


ATTTCTAGTC 


GTATCAGGTA 


AAGGGGTAAT 


TCGTTTTAGA 


5460 


CATGTTAATG 


ATGATGAAAT 


CATTGAATAT 


TATGTTTCTG 


GCGACAAATT 


AGAAGTTGTA 


5520 


GACATACCAG 


TAGGATACAC 


ACATAATATT 


GAAAATTTAG 


GCGACACAGA 


TATGGTAACT 


5580 


ATTATGTGGG 


TGAATGAAAT 


GTTTGATCCA 


AATCAGCCAG 


ATACGTATTT 


CTTGGAGGTA 


5640 


TAGCGCATGG 


aAAAACTGAA 


rTTAATGACA 


ATAGTTGGTA 


CAAGGCCTGA 


AATCATTOGT 


5700 


TTATCATCAA 


CGATTAAAGC 


ATGTGATCAA 


TATtTTAA 






5738 



(2) INFORMATION FOR SEQ ID NO: 85: 

<i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 9062 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 85: 



35 



40 



45 



ATCATCAACA 


AGAATGATAT 


TTTTCCCATC 


TACTATATCT 


TTTACCGCAG 


ATAACTTCAC 


60 


TCTCACACCT 


TGCTCACGTA 


ATTCTTGAGT 


TGGTTGAATA 


AATGTTCTTG 


CAACATATTG 


120 


ATTTTTAACT 


AGTC CCATTT 


CATATGGCAA 


ACCTATTTCT 


TCAGCATAAC 


CACTCGCAGC 


180 


TGATAGCGAT 


gAATTGGGTA 


CACCGATGAC 


CATATCAGCA 


TTTACAGGGC 


TTTCTTGGGC 


240 


TAATTTTTTA 


CCAGAAGCTT 


TACGTACTGC 


ATGGACATTT 


TTACCAGCTA 


TTGTTGAGTC 


300 


TGGTCTAGCA 


AAATAAATAT 


ATTCCATCGC 


AGAAATTGCA 


GTTGTCGTAT 


GATGTGTATA 


360 


AGATTTAACT 


GTAATACCTT 


TATCGTTAAT 


CACGACATAT 


TCACCTGCAT 


GAATATCTTG 


420 


AACAAATTCT 


GCACCTAACA 


CATCTATTGC 


ACATGTTTCA 


CTTGCAAGGA 


TGTATGTCCC 


480 


ATCTTTCATT 


TTACCTACAA 


CAAGTGGTCT 


GATAGCATTT 


GGATCTACTG 


CGCCATATAA 


540 


CGCATCTTTA 


GTTAAAATCG 


CAAATGTAAA 


ACCGCCTTTA 


ACTTTTCGCA 


AACTTTCTTT 


600 


CAACGCTTCC 


TCAAAAGTAG 


GAGCTTTACT 


TCGACGTATC 


AAATGCATAA 


TGACTTCAGT 


660 


ATCAGAAGAC 


GAATGGAAGA 


TAGCACCTTG 


TTTTTCTAAA 


TTCTGACGCA 


ATGATTTAGC 


720 
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OGGTTOAATA TTTTCAATAC CTTTATTACC TGAAGTAGCA TAACGGACGT GACCAATTGC 840 

ATGTTOATAT CCTTTTAATG GTTCCATTTG ATCATCTTTA ATCGCTTCAG TTAOTAAGCC 900 

5 TAATCCTCGC TCGCCTTTTA ATTCATTTTG ATCAGAAACA ACTATACCTO cACCTTCTTG 960 

ACCACGATCT TGCAAACTAT GAAGTCCCAT ATAtGTTAGT TGCGCTGCtT CaGGATGATT 1020 

CCAAATACCA AACACGCCAC ATTCTTCGTT TAATCCTGAG TAGTTAAACA TTGaGCAATT 10 B0 

10 

GCCCCtTCCC ATATTTGTTT AATATCTGAA ACATTTTCAC TAATCTCTGT aTATGGTGTT 1140 

GTTACCTTGr aATTATCACT ATCTGTTAAA AGTCCAATTT CTATTGCATT ATCAATATTT 1200 

15 AAAGTTTTAC CTGATTTAAC AGAAACAACA TATCGGCCTT GCGTCTCACT AAACAATTGT 1260 

GCATTTGTTA TATCTATTGA AGATTTTAAT CCTAAACCGT AATGCGCACT TAGTTTAGCT 1320 

AAGGTAATCA GTAAGCCACC TTTACCAACT GTTTGAACAT GTGATAATAG TCCTTCACGA 13 B0 

2o ATAGCGGTCT TGATTGATTC ACCTTTTTCA ACTTCTGAAC TCAAATCTAA TGACTCAAAT 1440 

TCATGATTAA CTTTGCCATA AATTAACTTT TCAAGTTGAC TACCACCAAA GTCGTCCTTA 1500 

GTATCACCGA TTAAATATAA TTTATCTCCA ACTTGAGGTT CAAAATCATT TAAATAATTT 1560 

25 ACATTTTCAA TCAAACCTAC CATTCCAACA ACTGGTGTTG GGAAAATAGA AGTACCTTTC 1620 

GTTTCGTTAT ATAAAGATAC ATTACCAGAA ACTACTGGTG TCTTAAGAAT GTCGCATGCT 1680 

TCTGCCATAC CTTTCGTTGA ATCTATCAAC TGTTGATAGA riTClUTlTT TTCAGGAGAA 1740 

30 CCATAATTTA AACAATCTGT CATTGCTAAT GGTGTTGCAC CCACGGCAAT TAAATTTCGA 1800 

TAAG CTTCAG CTACTACCAT CTTTCCACCT TCATATGGAT TGTTATATAC ATAACGCGCT 1860 

TCACCATCAA TTGTTGAAGC AATTGCCTTA TTTGTGCCTT CCACACGTAC TACCGATGCT 1920 

35 

TGAAGTCCTG GCTTAATTAT CGTATTGGCA C CAACTTGTT . GGTCGTATTG . AT CAT AT AAA 19B0 

TAGTGTTTAG ATGCTATAGT CGGATGCTTA AGTAATTTAA AGAAAGTATC TTTAACATCG 2040 

ATGTGTGTAT AATCATTTTT AGAAGTATTA TAATCTTTTT CTTCTCCTTC TAAAATATAT 2100 

40 

ACAGGTGCTT CATCAGCTAG TGGTTCAACT GGAATGTCAG CATAAACTTC GTCATCATAT 2160 

GTTAAAACAA AACGATTTGT ATCTGTAACT TCACCTATAA CAGCACTATC CAATTCGTGC 2220 

4S TTATCAAATA AATCTAAGAA TTTTTGTTCA GTACCTTTTT CAACAACTAG TAACATACGT 2280 

TCTTGAGTTT CTGAAAGCAT CATTTCATAA GGAGAAATAC CTGGCTCACG TGTTGGCACT 234 0 

TGTTCTAATC TCAAATGTAA CCCACTACCA C C TTTTGCCG CCATTTCAGA CGATGAAGAT 2400 

SO GTTAAACCAG CAGCACCCAT ATCTTGAATA CCAACTAATT CATCAAATGT AATTGCTTCA 2460 

AGTGTTGCTT CCATTAATTT TTTACCTACA AATGGATCAC CGATTTGTAC AGAAGGTCGT 2520 
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CGACCAQTTT TCAAACCAAC ATAAATGACC GAATTACCTA CACCTTTTGC TGTGCCTTTT 264 0 

TGAATCATGT CGTGATTGaT AACACCAACA CACATTGCAT TAACAAGTGG ATTGCCATCA 2700 

5 TAACGTTCAT CAAATTCGAT TTCACCAGCA GTTGTTGGaA TACCAATGCA GTTACCATAA 2760 

CCTCCGATAC CCTTTACAAC ACCTTTAAGT AATCTTTGGT TTTGTTTATT ATCTAATTCT 2 820 

CCAAATCTAA GACTGTTTAA CAAATTAATA GGTCTAGCCC CAATAGAGAC AATGTCACGA 2880 

10 

ATGATTCCAC CAACGCCTGT AGCAGCCCCT TGATATGGTT CAATTGCTGA TGGATGATTG 2940 

TGAGACTCTA CTTTAAATAC TACGGCTTGA TTATCACCTA TAT CGACTAC CCCTQCACCT 3000 

TCACCAGGCC CCATAAG CAC ATGGTcACCT GACGTAGGAA ATTGCTTTAA AAACGGTTTA 3060 

15 

GAATGTTTAT AAGAGCAATG TTCACTCCAC ATAACAGAAA AGATACCTGT TTCTGTAAAG 3120 

TTAGGTTGTC TGCCTAAAAT ATCGCAAACT TTTTCATATT CTTGATCaCT TAATCCCATA 3180 

2 0 TCTTGATATA CTTTTTCAAG TTTAATTTCT TCAACGCTTG GTTCGATAAA TTTAGACATG 3240 

TTGTTCCCTC CAACTTTTTA CCATCGCTTC AAATAATTTC ACACCACTAT CAGTACCTAA 3300 

CAACGTTTCT AAAGCTCTTT CagGATGtGG CATCATGCCA CATACATTGC CTTTTTCGTT 3360 

25 AACAATTCCT GCAATATCAT CATATGAACC GTTCGGATTA TTCACATATT TCAGAATAAT 3420 

TTGATTGTTA GCTTTTAATT GTTGATATAT TTCATCAGTA CAATAATAAT GACCTTCACC 3480 

GTGAG CTACA GGATATATAA CTTTTTCACC TTGTTCATAA AGATTTGTAA ATGCCGTTTG 3 54 0 

30 ATTATTCACT ATTTCTAACT CTTCATTT CT ACTAATAAAT AAATGTGAAT CGTTATGCAA 3600 

TAATG CACCA GGTAATAAGC CTATTTCAGT TAAAATTTGA AACCCATTAC AAACACCTAA 3660 

TACTGGCTTA CCTTCAGCTG CAAGACGTTT AACTTCCGAA ATAATCGGsG CTACACTAGC 3720 

35 

CATTGCCCCA GATCTTAAGT AATCCCCGAA TGAAAATCCA CCAGGAATAA GTACGCCATC 3780 

AAATGCACTT AGTGATGTTT CTCTATAATC TACATATTCC GCTTCAACAC CACTTTTAAT 3840 

AGCAGCATTA AACATGTCTC TATCACAATT CGAACCTGGA AAAACAAGAA CCGCAAATTT 3900 

40 

CATTTTATGC ATTCTCCTTT TCATCATCTA ACACTTTATA GCTATATTCT TCAATCACTG 396 0 

TATTTGCAAA CAATTTTTCA CTTAGAGTTG TAATAATGTT GTGTACCTTT TCATCACTAA 4020 

45 CCTCATCCAC TGTCATATAT AATACTTTTC CTACACGAAT ATCATTCACT TGTGCATAAC 4 080 

CTAAGTCATG TACAGCTCGA GTAAG CGTTT GTCCTTGCGT ATCTAATACT TGTGGTTGTA 414 0 

ATGTGATATG TAGTTCAATT GTTTTCATTA TTTTAAATCC TCCAATTTGT TTAAAAATAT 4200 

50 TTGATATGTT TCAATCAGTG ATCCAGTGTT ATTTCTATAT ACATCTTTAT CAAAGTTTGC 4260 

ATTGGTAGCT TTAT CCCAAA TTCGACATGT ATCTGGAGAT ATTTCATCCG CTAACAAAAT 4320 
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ATCCATTAAT 


' TGTTTCAACA CATTATTAAT 


CTTTAATGCT 


TTGGATTTTA 


GTATTTCAAT 


4440 




ATCTTCATCT 


GATGCTATAT 


TGAGCAATTT 


AACATGGTCA 


TCOGTTATCA 


ACGGATCATT 


4500 


5 


TAACGCATCA 


TTTTTATAGA 


AAAATTCTAC 


AAGTGGTTCT 


CTAAAAACTT 


CACCATTTTC 


4560 




AAAACCTAAA 


CGCTTTGTAA 


TAGATCCACT 


AGCAATATTA 


CGAACAACTA 


CTTCTAATGG 


4620 


10 


AATTATTTTC 


ACAGGCTTAA 


CTAATTGTTC 


TGTTTCAGAT AATTGTTTAA TAAAGTGACT 


4680 


TTCTATTCCA 


TTTTCTTGTA 


AATATTTAAA 


TATAATAGAA 


GTAATTTGAT 


TATTTAATCG 


4740 




CCCCTTACCT 


GCCATTGTGT 


CTTTCTTAGC 


CCCGTTTCCA 


GCAGTAACTT 


CATCTTTATA 


4800 


15 


TTCAACTCTT 


AATTCATTTT 


CTTGATTTGT 


TGAGAAAATG 


OGcTTCGCTT 


TTCCTTCATA 


4860 




TAATAATGTC 


ATGCTTTAAT 


TACTCCCCTC 


AAATTTAGCG 


TACATATCTT 


GTTCAQTTTG 


4920 




GTTTACATCA 


TTCGTTAGTA 


CAGTCATATG 


CCCCATTTTT 


CTGCTATCTT 


TACGCTCAGA 


4960 


■ on 


CTTACCATAA 


ATATGTAAGT 


GCCACTCTGG 


ATGTTCATTA 


AATTCATTTT 


CCAATAAATC 


5040 




TAAATCTTTA 


C CTAGTAAGT 


TCATCATGAC 


TGCTGGCTTT 


AATAATTCAA 


TTGAATTTGG 


5100 




TAATGATTGT 


CCGGTAACTG 


CTAAAATATG 


AGTATCAAAT 


TGTGAATAAT 


CACATGCTTC 


5160 


25 


. AATTQAATAA 


TGTCCGGAAT 


TGTGAGGCCT 


TGGTGCTATC 


TCGTTCACAT 


ACAATTGGTT 


5220 




GTTACTATCT 


ATAAAAAATT 


CAACTGTAAA 


TGTTCCAATG 


AAATGAATCG 


ATTGGATAAT 


5280 




TTTATTAACT 


TGCTCTTTCG 


CCTCAGCTGT 


TTTATCTATT 


CTCGCTGGAA 


CAATTGTTTT 


5340 


30 


GAAAAGTATT 


TGATTTCTAT 


GCTCATTTTC 


TTGTAATGGG 


AAAAAAGTGA 


TTTGATTGTT 


5400 




GTTTCCTCTT 


GTAACAGTAA 


GAGATACTTC 


TTTCTTGATA 


TTCAAATATT 


TTTCAGCTAC 


5460 




GCATTCACTA 


GTTTCAATTA 


ATTTAAAACC 


TTCTTGTAAG 


TCTTTTTCGT 


TGTTAATTAA 


5520 


35 


AACTTGACCT 


TTG CCATCGT 


AGCCACCAAA 


T C TAG TTTTT 


ACAATAAAAG 


(3ATATPPTAA 


5580 




TGTT5*CAATT 


GCTTTGTCAA 


TATCTGTAGA 


TTCTTTTACT 


GAAATGAACG 


GGACAACTTT 


5640 


40 


GGTACCAGCA 


CTTTTTAATG 


TTTCTTTTTC 


AGTTAAG CG A 


TCTTGTAATA 


ACTGTATAGC 


5700 


TTGGTAACCT 


TGCGGAATAT 


TGTACTTTTC 


ACATAATAGT 


TTTAATTGTT 


GGGCTGAAAT 


5760 




GTTTTCAAAT 


TCATAAGTAA 


TCACATCACA 


TTTTTGTCCT 


AATTGATTGA 


GTGCCTTTTC 


5820 


45 


ATCGTCATAC 


TTGGCTTGTA 


TAAATTCGTG 


TGCAACGTAT 


CTACATGGAC 


AATCTTCAGA 


coon 
5880 




AGGATCCAAT 


ACAACCACTT 


TATAACCCAT 


TTTTTGAGCT 


GATTGTGCCA 


TCATCTTTCC 


5940 




AAGCTGACCA 


CCACCAATAA 


TGCCAATAGT 


CGCACCAAAC 


TTTAATTTAT 


TGAAGTTCAT 


6000 


50 


TTTGCATGTC 


CTCCACTTTT 


TGAATTAACG 


AAGATTCATA 


CTGATTTAGT 


TTTTCAACTA 


6060 




AAGAAGGATT 


TTGAATACTT 


AACATTCTTG 


CTGCAAGTAT 


ACCTGCGTTT 


TTAGCACCTG 


6120 



55 



547 



EP0 786 519 A2 





AAGAATCTAT 


ACCCTTTAAA 


CTTTTTGTTT 


CAATCGGCAC 


TCCAATAACT 


GGTAGCGTCG 


6240 




TTAATGATGC AACCATACCT 


GGTAAATGTG 


CCGCACCGCC 


AGCGCCTGCA 


ATGATAATGT 


6300 


5 


TTATACCTCT 


TTCTCTCGCT 


TGAGAAGCAA 


ATTGAACCAT 


CATTTTTGGC 


GTACGATGTG 


6360 




CGGATACTAC 


TTGTTTTTCG 


TACGGAATTT 


CAAAATAATC 


CAACATGTTA 


CAACTCTCTT 


6420 


10 


GCATAATTTT 


CCAATCGGAA 


GAACTGCCCA 


TAATGACTGC 


TACTTTCACT 


TTGTACACCC 


6480 


TTTCAAAAGT 


TTGAATTGTG 


AATTACTTTA 


GTTGTATATT ATAGATATAG 


CATAACAAGC 


6540 




AATTTCTGCT 


TTTTCAATCA 


AAAATCGAAC 


TTTATTTTGA 


TTTTTTATTT 


GAATTTACGT 


6600 


15 


CTTTTGCTAT 


GTAAATTAGT 


TTTATAAACT 


AACAAAGTTA 


GGATATTGAC 


AATAGGAGGA 


6660 


GAAGTTTTTA 


TGGTTGCTAA 


AATTTTAGAT 


GGTAAACAAA 


TTGCCAAAGA 


CTACAGACAG 


6720 




GGGTTACAAG 


ATCAAGTTGA 


AGCGCTAAAA 


GAAAAGGGTT 


TTACACCTAA 


ATTATCCGTT 


6780 


20 


ATATTAGTTG 


GTAATGATGG 


CGCTAGTCAA 


AGTTATGTTA 


GATCAAAAAA 


GAAAGCAGCT 


6840 




GAAAAAATTG 


GTATGATTTC 


AGAAATCGTA 


CATTTGGAAG 


AAACAGCTAC 


TGAAGAAGAA 


6900 




GTATTAAACG 


AACTAAATAG 


ACTAAATAAT 


GATGATTCTG 


TAAGTGGTAT 


TTTGGTACAA 


6960 


25 


GTACCATTAC 


CAAAACAAGT 


TAGCGAACAG 


AAAATATTAG 


AAGCAATCAA 


TCCTGAAAAA 


7020 




GATGTGGACG 


GTTTTCATCC 


AATAAATATA 


GGGAAATTAT 


ATATCGATGA 


ACAAACTTTT 


7080 




GTACCTTGCA 


CACCGCTCGG 


CATCATGGAA 


ATATTAAAAC 


ATGCTGATAT 


TGATTTAGAA 


7140 


30 


GGTAAAAATG 


CAGTTGTAAT 


TGGACGAAGT 


CATATTGTCG 


GACAACCAGT 


TTCTAAGTTA 


7200 




CTACTTCAAA 


AAAATGCATC 


AGTAACAATC 


TTACATTCTC 


GTTCAAAAGA 


TATGGCATCA 


7260 




TATTTAAAAG 


ATGCTGATGT 


CATTGTCAGT 


G CAGTTGGT A 


AGCCTGGTTT 


AGTAACAAAA 


7320 


35 


GATGTGGTCA 


AAGAAGGAGC 


AGTAATTATC 


GATGTTGGCA 


ATACGCCAGA 


TGAAAATGGC 


7380 




AAAXTAAAAG 


GTGACGTTGA 


TTATGATGCG 


GTTAAAGAAA 


TTGCTGGAGC 


TATTACACCA 


7440 


40 


GTTCCTGGTG 


GCGTTGGTCC 


ATTAACAATT 


ACTATGGTAT 


TAAATAATAC 


TTTGCTTGCA 


7500 


GAAAAAATGC 


GTCGAGGTAT 


TGATTCGTAA 


AGAGCCTGAG 


ACATAAATCA 


ATGTTCTATG 


7560 




CTCTACAAAG 


TTATAATGGC 


AGTAGTTGAC 


TGAACGAAAA 


TTCGCTTGTA ACAAGCTTTT 


7620 


45 


TTCAATTCTA 


GTCAACCTTG 


CCGGGGTGGG 


ACGACGAAAT 


AAATTTTACG 


AAAATATCAT 


7680 




TTCTGTCCCA 


CTCCCTAATA 


ACTGAGTTTT 


AATGAAGTCT 


TTTAACCCAC 


ATTAAATATT 


7740 




ATTTTGCAAT 


TGCAATGAAT 


AACAAGAAAA 


ATCTGGGACA 


TTAATCGATC 


AAATGCTCCC 


7800 


SO 


TTCAAAGTAG 


ACATTGAATA 


AATGAAGGCT 


TTGAAGGGAG 


CATTTCACTT 


TGTACTTGGC 


7860 




TCAACAATTT 


TATATAGACA 


GTAGTTAATT 


GAATGAAAAT 


AAGCTTGTAA 


CAAGTTTTCA 


7920 
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GTTGGGGATG GGCCCCAACA CAGAAGCTGT GACTATGATA AAGTACTACT ACATAGTTAA 8040 

TCATTAGTGG TTCTTTATCA TTTTCGCCTC CCTTTTCTTA TTGTTTTGAT ACACAAAAAT 8100 

5 

TTAAGTTCAA ACTGTCGAAT AAAGTTATAT TTGATTTCAA ATTATCCCTA AATTATTAAT 8160 

TkTACAATTG TGGCAGATTT TCAAAATAAT AATTATTTCC TCATTATTTA TAAATTTATA 8220 

TTTAAATTTC ATTCTTTATA GGGTAAGATT AGGACTATAG TATGATGTGT ArATAATATA 8280 

10 

AATTAAGGTA TAGTAAAGCT AACTCAGAAA TGACTTATCA TTCGGAGGTT ACATTATGAA 8340 

TAAACTATTA CAGTCATTAT CAGCCCTCGG TGTTTCTGCT ACACTAGTAA CACCAAATTT 8400 

15 AAATGCAGAT GCAACGACGA ATACTACACC ACAAATTAAA GGCGCTAATG ATATCGTTAT 8460 

TAAGAAAGGT CAAGATTATA ACCTTCTAAA CGGCATAAOT GCATTTGATA AAGAAGATGG 8520 

AGATTTAACC GATAAAATTA AAGTCGATGG CCAAATTGAT ACATCTAAAT CTGGTAAATA 8580 

20 TCAAATTAAA TATCATGTCA CTGATTCAGA TGGTGCAATT AAAATTTCCA CTAGGTATAT 8640 

TGAGGTTAAA TAGCCCTCAT CACTATACTG CAAATAAAAT GGTAGCAAAC GAACATGTTT 8700 

TGCTACCATT TTATTTGTTA TTCTAACTTC ATCTGCAACT TTAACCCAAA TATTGTATTT 8.760 

25 TTTCTGTATA CCAAAGGACT ACCTATCAAA TTATTAAAAC TTAACTGCTC TTTTTAAAAA 8820 

AATGTTTTGA TTTTGAACAA ACAAATTTCC ACTTTTCATT GTTTAACGAT AAATTACTTT 8880 

TGGCAAATTC CTTATTAAAA TGTTTGCGCT TCCTTTCAAT CAACTAGCCA TCATTTTCAA 894 0 

30 

TTTATTAGAC AATTTCAAAC TTTTTTTATT TTCATTCAAT TAAC CTTTAA TTGAAAGCTA 9000 

TTCTCAACTT TCCTTTTAAA TATGAAGCAA TTTTTTCAAA AACGCTATTA GTCACAAAAT 9060 

GT 9062 

3S 

(2) INFORMATION FOR SEQ ID NO: 86: 

SEQUENCE CHARACTERISTICS; 

(A) LENGTH: 273 8 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



45 (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 86: 

AAATATTTTT TCAAAACTAT GTGAAAATGG aCCATGTCtA aATCATGTAA TAATGCAGyA 60 

CATAATGCCA ACGGTCTmTC TTTATTGTCC CATGCAT CAT GACCAATAAA TGACTCATCA 120 

50 ATTAATCGTC TAACTATTTC ATACACACCT AAAGAATGTC CAAAGCGACT ATGTTCTGCT 180 

GTGTGAAAAG ATAGGTACAG TGTTCCTAGT TGTCTAATTC GACGTAACCT TTGGAATTCC 240 
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TCTTTAAAAA CTTTTTCTTC TACTAATTTT AAATCTACAT ATGCGTTAGT CATTATTCCC 3 60 

CTCCTTTTCG TTTAATATAA TATTTAATTT ACTTAAAATG CTTTGTACAT AAGTGCTAAG 4 20 

6 TCTAACTTTT CGCCATACAT TTCTGGCTCA TAAGAGCGTA AGATTGTAAA ACCTTGCTCT 4 80 

TTATAGTAAG CTACTGCTTC TTCATTTTTA TTATCTACTT CTAAGTAAAC ACCTTCAAAT 54 0 

TTATCTTCAA AACGTGATAA TCCTTCATTT AACAATGCTG TACCATAACC TGTATGTTGC 600 

10 GATTCTGGTT TAACATAATG AGCTGATAAA TATAATTCTT CACCGTAAAT AAAGTTAGCA 660 

AAGCCAACGA TGTCATTACC TTCTTCAACG ACTAAGAATA ATTGTTCTTG AAGTCTTTTC 72 0 

TTTAAATGAT GTTCATTATA TGAAGCTtCT AACAAGTGAT TAACTGTTGT CGCAGCGTAT 78 0 

IS 

ATATTTAAGT ATGTATTAAA CCAAGCTTTA GTTGCGACAT CTCTAATTTG AACAACATCT 840 

TTTTCAGTTG CTTGTCTTAC CTTGAACATG ACTTTCTCCC CTTATTAACA AGTTTTAATA 900 

ACGGCATTAT ACCACAACTT GCTCAATACT TAATAAACAA TGATTGTCTA TTCAATTTAT 960 

SO 

AT ATt TAT AT TTTCCGTTAA AATTAAAAAT AAAAAATAAC GAAGCAAAAA AtCACTTCGT 1020 

TTAGTATGAG GTATGTCTTA TTGCAATATA CTATTCCACT CAGTTGCACG TGCTAAGGCA 1080 

2S TAGTTGTCTT TCATGATGTC ACCAGGCTTT TCAGCAGTTC CAATAATATA ACCATTTAAA 1140 

GTGGCACCTA rAAAGTCTAA ACTATATTTC ATTTG CGTAA TTGCTGGTTC GCTTTTATTT 1200 

TTGGAGAATC TCCACCAACT AAAATAACTC TAAAATC CTT TTCGGCCATT TGTGCCTTAA 12 60 

30 AATTAGGATA TCGTTTATCT TGTAATGTTT CTGACCAATG TTCGATAAAT GCTTTCAATG 1320 

GTGCTGAAAT GCTATAC CAA TACACTGGTG ATGCAAAAAT AATTGTATCA CTAG CCAATA 13 80 

TTTTATCTAG AATCGGCAAA TAGTCATCGT CATATGAAGT AATAGTCTCT GCTGTATGTC 144 0 

35 TCACGTCACG TATCGGTTTA AACTGATGTT GTGTCACGTC AATCCATTGA TACTCTAAAT 1500 

CTTGCAAAGC GAATTTTGTT AATTGTGCAG TATTACCGTT TGGTCTACTC CCACCAAACA 1560 

AAACAGTAAT CATTTTAGCC TAACCTCACT TTTGATTAAT AAATATCTGT GTTTTTCGTT 1620 

40 

ACCTAATTAT ACTATCATAA G CTTTGCCTA CCGAATAGTA AAACGCTTAC AACTTTTATA 16 80 

TAAATTTGAC GAAATTTCGT CATG CCTTAT ATAACGTCGT TTGTGATACG GGG CTAATTC 174 0 

ATGATGAAAT TAGATACATA TATCACCATT AAATACAATT CATTTAGTCT TCAATCGGAA 1800 

45 

ACAGTTCATC GATATATTGA ATCTCATCAT CTGATAAAAC GATATCTGCA GCTTTAATAT 18 60 

TTTCAACGAC TTGTTCTGCA CGTTTTGCAC CAGGAATAAT CACATCG AT A GCTGGTCTCG 1920 

60 TTAAATAAAA TGCTAATACA ATGTTCGCAA TTGAAGTTTG ATGTGCTGCA GCTATGCTTT 1980 

CCAAAGCTTT TACGCGACGC ACATTTTCTT CAAATACACC TGGTTTAAAA TCACGACGTG 2040 

55 



550 



EP0 786 519 A2 

GCTAATGGGA AATATGOAAT AAATGTGATT TGGTGATCAA CACAATATTG TAATACTGCC 2160 

TCATTTTCGC GATGCAATAA ATTATATTCT AACTGTACAA CATCAACGTA ACCATCTTTA 2220 

5 TTTGCTTCTT TAAGTTGATC TAATGTGAAA TTTGATACAC CAATTGCTTT AATCTTCCCT 2280 

TGTTCCTTAA GCTCTTGTAA TGCTGCAACT GCTTGATCTT TCGGAGTGTT GTTATCCGGA 2340 

AAATGAATAT AATATAAATC GATATAATCA GTTTGTAGAC GTTTCAAACT ATTCTCAACT 2400 

10 

TGTTGTTTTA AATATTCCGG TTGATTGTTC TGATGTACTT CTTGATTTTC ATCAAATTCA 2460 

TGAGACCCTT TCGTAGCAAT TTTAATTTGC TCTCGCGGAT ATTCTTTAAC AACTTCTCCA 2520 

15 ACCAATTCTT CTGATCGTTC TGGCCCATAA ATATATGCCG TATCTAATAA ATTAATACCA 25 BO 

TGATTAATGG CTTGACGAAC AACATCTTTT CCTTGTTCTT CATCTAAGTT CGGATATAAA 2640 

TTATGCCCAa CCTAtGCGTT CGTCCCAAGT GCGATTGGAA ACACTTCAAC ATCAGATTTA 2700 

2o CCTAAGTTTA CAAATTGCTn CATTAGACCC AGCnCCTT 2738 

(2) INFORMATION FOR SEQ ID NO: 87: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH : 9425 base pairs 
25 (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 87: 



35 



40 



45 



GATTAGATGA 


TATTTAACGA 


AAATTAaGrT 


GmAATACT t G 


AATGTArGAa 


GTCTGATGTC 


60 


G AAAAT AG CT 


ATTAAAATAG 


AGTAGACGTA 


ATGtAAATGA 


AAGCACCTAA 


AATAGAAAAA 


120 


TTTCAAAAAT 


AGCGTAATTA 


TTATAATAAA 


TAGACTGCCA 


ATAAAATGCA 


ATTTTTCACT 


180 


TATAACATTC 


TTCAAAAAAT 


AATAGCAAAA 


TTATGTAAAA 


AATATCTTGT 


CATGGCAAGA 


240 


TTGGCTGTGC 


TATAATCTAT 


CTTGTGCTTA 


AGAACGGCTC 


CTTGGTCAAG 


CGGTTAAGAC 


300 


ACCGCCCTTT 


CACGGCGGTA ACACGGGTTC 


GAGTCCCGTA 


GGAGTCACCA 


rrri'iTAGGT 


360 


CTCGTAGTGT 


AGCGGTTAAC 


ACGCCTGC CT 


GTCACGCAGG 


AGATCGCGGG 


TTCGATTCCC 


420 


GTCGAGACCG 


TACAAATGCC 


TATCCAAGAG 


GATAGGCATT 


TTTTTGCGTT 


TAATATTATA 


480 


TTAATAAAAG 


ATATATGGAC 


GAATGATAAT 


CATATTGATT 


TATCTGTTCG 


TCCATTTTCT 


540 


TTAAAATGTA 


TGAACCTCAA 


GTAACTTAGT 


GGTTGGATAT 


GAAAGATAAA 


CGTAGACAAT 


600 


AAAATCTTTA 


TTAGACGTAC 


AAACATATGC 


TACTGTCAAC 


ATATTTCTTC 


GTTGTGATAT 


660 


GCCACCAGTC 


CTCCATAACA 


TCAATTGTTA 


AAGTAACGAA 


TAACGAATAA 


TGATATTTAT 


72 0 
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GACCTCATCA TTQTGTTAAA TATCATTGTC 
AGTAATATAT AAGTTTATAT TOGAAAATAG 
6 AATAGGTTAC TATACGTTAT AAGACGGAAA 

ATCCTGTGAT TTTTTACACA AACATAAACG 

AATGATTTAA GAAAAGAGGT TTATGCAAAT 

10 

AAAACCGATT GCTGATATTT TAGAATTTAA 

TGCATACGAT GGTAATGATG CAGTCGACTT 

ACTAGATATC ATGTTACCTG GTCGTGATOG 

15 

ATACGAAATG CCAATAATAA TGCTTACTGC 
TTTAGAACTA GGTGCAGATG ACTATGTAAC 
ACGTGTGAAA GCGAACTTAC GTCGTCATTA 

20 

AACGAATGAA ATCACAATTA AAGATATTGT 
ACGTGGCGAA GATATTGAAT TAACACATCG 

2 s ACATATGGGA CAAGTAATGA CACGTGAACA 
CTTTGGCGAT GTACGTACGG TCGATGTAAC 
TGATCCGTCA CATCCTGAAT ATATTGTGAC 

30 ACATGAGTAG AGGTCGAAAC GAATGAAGTG 

ATTTGTAATT GTTTATGTAT TACTGATTAT 
TACAAATAAC CTTGAAAAAG AGCTGCTTGA 

35 GAAACAATTA GAAATTAGTA TTGAAAAAGT 
AAAAGATATT CAAAATTTAT TAAGTGAGTA 
TTTTATAGAT AAAGACCAAA TTATTATTGC 

40 

CAATCAAAAA GCGAATGATA GTTCTGTCCA 
TCATTTAATT TTAAAAGATT ATGGCGGTGG 
AGTTAAAGTC GATAAAAAGG TAATTGGTAA 

45 

TTATAACCAA TTAAATAATA TAAATCAAAT 
AATgCACAGT CATCCTAGGA TTCTTTATAG 
50 TGCGTAACCA GACGGTCGAA ATGTCCaGAG 
GTAATGATGA AATTGGCGAA TTAGCTTTAG 
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ACAATCCGCC GTGAGAAACT AATAAAAAAT 84 0 

AATTAATAGC TTATAAATGG TAAATTATAT 900 

ATGCGCACAA TAACAAAAAT AGTAAGCGAC 960 

ATAAAGAACA AAAAATGATA AAATAATATT 1020 

GGCTAGAAAA GTTGTTGTAG TTGATGATGA 1080 

CTTAAAAAAA GAAGGATAOG ATGTGTACTG 114 0 

AATTTATGAA GAAGAACCAG ACATCGTATT 1200 

TATGOAAGTA TGTCGTGAAG TGCGCAAAAA 1260 

TAAAGATTCA GAAATTGATA AAGTGCTTGG 1320 

GAAACCGTTT AGTACGCGTG AATTAATCGC 1380 

CTCACAACCA GCACAAGACA CTGGAAATGT 144 0 

GATTTATCCA GACGCATATT CTATTAAAAA 1500 

TGAATTTGAA TTGTTCCATT ATTTATCAAA 1560 

TTTATTACAA ACAGTATGGG GCTATGATTA 162 0 

GATTCGTCGT TTACGTGAAA AGATTGAAGA 168 0 

GCGTAGAGGC GTTGGATATT TCCTCCAACA 174 0 

GCTAAAACAA CTACAATCCC TTCATACTAA 18 00 

CATTGGTATG CAAATTATCG GGTTATATTT 18 6 0 

TAATTTTAAG AAGAATATTA CGCAGTACGC 192 0 

ATATGACGAA AAGGGCTCCG TAAATGCACA 1900 

TGCCAACCGT CAAGAAATTG GAGAAATTCG 204 0 

GACGACGAAG CAGTCTAACC GTAGTCTAAT 2100 

AAAAGCACTA TCACTAGGAC AATCAAACGA 216 0 

TAAGGACCGT GTCTGGGTAT ATAATATCCC 2220 

TATTTATATC GAATCAAAAA TTAATGACGT 2280 

ATTCATTGTT GGTACAGCTA TTTCATTATT 234 0 

CGCGAACGAT TACCAAACCA ATCACCGATA 24 00 

GTAACTATAC GCAACGTGTG AAGATTTATG 24 60 
CATTTAATAA CTTGTCTAAA CGTGTACAAG . 2520 
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GTGATGGTAT TATTGCAACA GACCGCCGTG GACGTATTCG TATCGTCAAT GATATGGCAC 2640 

TCAAGATGCT TGGTATGGCG AAAGAAGACA TCATCGGATA TTACATGTTA AGTGTATTAA 2700 

5 

GTCTTGAAGA TGAATTTAAA CTGGAAGAAA TTCAAGAGAA TAATGATAGT TTCTTATTAG 2760 

ATTTAAATGA AGAAGAAGGT CTAATCGCAC GTGTTAACTT TAGTACGATT GTGCAGGAAA. 2820 

CAGGATTTGT AACTGGTTAT ATCG CTGTGT TACATGACGT AACTGAACAA CAACAACSTTG 2880 

10 

AACGTGAGCG TCGTGAATTT GTTGCCAATG TATCACATGA GTTACGTACA CCTTTAACTT 2940 

CTATGAATAG TTACATTGAA GCACTTGAAG AAGGTGCATG GAAAGATGAG GAACTTGCGC 3000 

15 CACAATTTTT ATCTGTTACC CGTGAAGAAA CAGAACGAAT GATTCGACTG GTCAATGACT 3060 

TGCTACAGTT ATCTAAAATG GATAATGAGT CTGATCAAAT CAACAAAGAA ATTATCGACT 3120 

TTAACATGTT CATTAATAAA ATTATTAATC GACATGAAAT GTCTGCGAAA GATACAACAT 3180 

20 TTATTCGAGA TATTCCGAAA AAGACGATTT TCACAGAATT TGATCCTGAT AAAATGACGC 3240 

AAGTATTTGA TAATGTCATT ACAAATGCGA TGAAATATTC TAGAGGCGAT AAACGTGTCG 3300 

AGTTCCACGT GAAACAAAAT CCACTTTATA ATCGAATGAC GATTCGTATT AAAGATAATG 3360 

25 GCATTGGTAT TCCTATCAAT AAAGTCGATA AGATATTCGA CCGATTCTAT CGTGTAGATA 3420 

AGGCACGTAC GCGTAAAATG GGTGGTACTG GATTAGGACT AGCCATTTCG AAAGAGATTG 3480 

TGGAAGCGCA CAATGGTCGT ATTTGGGCAA ACAGTGTAGA AGGTCAAGGT ACATCTATCT 354 0 

30 

TTATCACACT TCCATGTGAA GTCATTGAAG ACGGTGATTG GGATGAATAA TAAGGAGCAT 3600 

ATTAAATCTG TCATTTTAGC ACTACTCGTC TTGATGAGTG TCGTATTGAC ATATATGGTA 3660 

TGGAACTTTT CTCCTGATAT TGCAAATGTC GACAATACAG ATAGTAAGAA GAGTGAAACG 3720 

35 

rAACCTTTAA CGACACCTAT GACAGCCAAA ATGGATACAA CTATTACGCC ATTTCAGATT 3780 

ATTciTTCGA AAAATGATCA TCCAGAAGGA ACGATTGCGA CGGTATCTAA TGTGAATAAA 3840 

CTGACGAAAC CTTTGAAAAA TAAAGAAGTG AAGTCCGTGG AACATGTTCG TCGTGATCAT 3 900 

40 

AACTTGATGA TTCCTGATTT GAACAGTGAT TTTATATTAT TCGATTTTAC GTATGATTTA 3 960 

CCGTTATCAA CATATCTTGG TCAAGTACTG AACATGAATG CGAAAGTACC AAATCATTTC 4 020 

45 AATTTCAATC GTTTGGTCAT AGATCATGAT GCTGATGATA ATATCGTGCT TTATGCTATA 4 080 

AGCAAAGATC GCCACGATTA CGTAAAATTA ACAACTACAA CGAAAAATGA TCATTTTTTA 4140 

GATGCATTAG CAGCAGTGAA AAAAGATATG CAACCATACA CAGATATCAT CACAAACAAA 4200 

50 GATACAATTG ATCGTACGAC GCATGTTTTT GCACCAAGTA AACCTGAAAA GTTAAAAACA 4260 

TATCGCATGG TATTTAACAC GATTAGTGTT GAGAAAATGA ATGCTATACT ATTTGACGAT 4320 
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GCAAACTATA ACGATAAAAA TOAAAAATAT CATTATAAAA ACCTGTCCGA AGATGAAGCG 444 0 

AGTTCCAGCA AAATGGAAGA AACGATTCCA GGAACCTTTG ATTTTATTAA TGGTCATGGT 4500 

GGTTTCTTAA ACGAAGACTT TAGATTGTTT AGTACGAATA ATCAGTCAGG CGAGTTAACA .4560 

TATCaACGTT TCCtTAATGG TTAT CGAACG TTTAATAAAG AAGGTTCTAA TCAAATTCAA 4620 

GTCACTTGGG GTGAAAAAGG CGTCTTTGAC TATCGTCGTT CGTTATTACG CAC CGACGTT 4680 

GTTTTAAATA GTGAGGATAA TAAATCGTTG CCGAAATTAG AGTCTGTAOG TTCAAGCTTA 474 0 

GCGAACAATA GTGATATTAA TTTTGAAAAA GTAACAAACA TCGCTATCGG TTACGAAATG 4800 

CAGGATAATT CAGATCATAA TCACATTGAA GTGCAGATTA ACAGTGAACT CGTACCGCGT 4860 

TGGTATGTAG AATATGATGG CGAATGGTAT GTTTATAACG ATGGGaGGCT TGaATAAATG 4920 

AACTGGaAAC TGACAAAGAC ACTTTTCATT TTCGTGTTTA TTCTTGTCAA CATCGTGTTA 4980 

20 GTATCGATTT ATGTTAATAA AGTCAATCGC TCACACATTA ATGAAGTCGA GAGTAACAAT 5040 

GAAGTTAATT TTCAGCAAGA AGAAATTAAA GTACCGACTA GTATATTOAA TAAATCAGTT 5100 

AAAGGTATAA AATTAGAGCA AATTACAGGG CGATCAAAAG ACTTTAGTTC TAAAGCTAAA 5160 

25 GGCGATTCGG ATTTGACCAC ATCAGATGGT GGAAAATTAT TGAATGCGAA CATTAGTCAA 5220 

TCGGTAAAGG TCAGTGACAA TAACTTAAAA GATTTGAAAG ATTATGTTAA CAAGCGCGTA 52 8 0 

TTTAAAGGTG CTGAATATCA ATTAAGCGAG ATTAGTTCAG ATTCTGTAAA ATATGAACAA 534 0 

30 ACGTATGATG ATTTTCCGAT TTTAAATAAC AGTAAAGCGA TGTTAAACTT TAATATAGAA 54 00 

GATAACAAAG CGACTAGTTA TAAACAATCA ATGATGGATG ACATTAAGCC CACAGATGGT 54 60 

GCAGATAAGA AGCATCAAGT GATTGGTGTG AGAAAAGCAA TCGAGGCATT ATATTATAAT 5520 

CGTTAGTTGA AAAAAGGTGA TGAAGTCATT AATGCTAGAC TCGGTTACTA CTCAGTCGTG 5580 

AATGAAACGA ATGTTCAATT GTTACAAC CA AACTGGGAAA TTAAAGTGAA GCATGACGGT 564 0 

AAGGATAAAA CGAATACTTA CTATGTCGAA GCGACAAATA ATAACCCTAA AATTATTAAT 5700 

CATTAATATG AATCGTAATA AGCTAGCATT GCAAGCTCAT CATATGTGAG AAGCGGTGCT 5760 

AGCTTTTTTG CTGGTACGGT TTATTATGGC TGATGTTTTT GCGTCTCCAA CGTGCGCATT 5820 

TATTCATATT TTAAGTAGAA CCGCATTGTA AAATTAGTGT AACTGTTATT TTAAAAACTT 5880 

TAG TATTTG T CTAATCATTG TTATAATAAT TAAGAAATTC ATTGGACGTG ATTATCAAAA 594 0 

TTTAAATATA AGAAACCGGT CGATGAACTA AAGTTACATA ATAGGAAAGG TATACAAAAC 6000 

50 AGCTAATATA CTGATAGTTT CTGTAGGGAA AATCGTATAT TTGCACTGAT GTATATTGCA 6060 

GTCATATAGA GAGATTGACT GTTTAAAGAG AAAGGATGAG CCGCTTGATA CGCATGAGTG 6120 
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TAGTTGATGT TGGTTTGACT 


GGAAAGAAAA 


TGGAAGAATT 


GTTTAGTGAA 


ATTGACCGTA 


6240 




ATATTCAAGA 


TTTAAATGGT 


ATTTTAGTAA 


CCCATGAACA 


TATTGATCAT 


ATTAAAGGAT 


6300 


s 


TAGGTGTTTT 


GGCGCGTAAA 


TATCAATTGC 


CAATTTATGC 


GAATGAAAAA 


ACTTGGCAGG 


6360 




CAATTGAAAA 


GAAAGATAGT 


CGCATCCCTA 


TGGATCAGAA 


ATTCATTTTT 


AATCCTTATG 


6420 


10 


AAACAAAATC 


TATTGCAGGT 


TTCGATGTTG 


AATCGTTTAA 


CGTGTCACAT 


GATGCAATAG 


6400 


ATCCGCAATT 


TTATATTTTC 


CATAATAACT 


ATAAGLAAGTT 


TACGATTTTA 


ACGGATACGG 


6540 




GTTACGTGTC 


TGATCGTATG 


AAAGGTATGA 


TACGTGGCAG 


CGATGCGTTT 


ATTTTTGAGA 


6600 


IS 


GTAATCATGA 


CGTCGATATG 


TTGAGAATGT 


GTCGTTATCC 


ATGGAAGACG 


AAACAACGTA 


6660 




TTTTAGGCQA 


TATGGGTCAT 


GTATCTAATG 




TCATGCAATG 


ACAGACGTGA 


6720 




TTACAGGTAA 


CACGAAACGT 


AT W 1 W I T A CCT AT 


CG CATTTATC 


ACAAGACAAT 




£*7Q A 
D / O \J 


20 


ATTTGGCGCG 


TATGAGTGTT 






CGATATTGAT 


ACGGAAA A AG 


f o An 




AAGTATTGCT 


ATGTGATACG 


d AT A A AflPT A 


TTPP A AfY3r*P 
X X LLnAUMLL 


A AT A T AT A C A 


ATATA A ATYSA 
ninlAAAlvn 


oyuu 




GAGTCATCCG 


ATAAAGTTCC 




X X 


TATVYWrtTftP 
inl VvVtVVV? X k?V_ 


X X X X X lAlu X 




25 


TGTTGGTGGG 


AAATGGCTGT 


xv* X i\inu X X \» . 


AAA X 1 va 


& TTP & & & TYIT* 
Al lljAAnlu X 


(jiAAAAlAAl 


7020 




TOGATATTAA 


ATGTAATTTA 


lAHHlnnl X X 




atTraTri'i'B 
AA1\JH 1 X 1A 


AiAlAAubAI 


7080 




TATGATAATA 


TATTGGTGTA 


TG A H AGTT A A 


TGGAGGGAAC 


GAAATGAAAG 


V.1X X>\X 1AL X 


/ 14U 


30 


TAAAACAAGT 


GTATGGCTCG 




TAGTGTAATG 


GGATTATGGC 








CGCGGCTGAG 


CAG CAT ACAC 


r* A ATV5 AAAGT* 


ACATGCAGTA 


ACAACGATAG 


APAAAfiPAAP 






AACAGATAAG 


CAACAAGTAC 


CGPPAACAAA 


GGAAGCGGCT 


CATCATTCTG 


fiPAAAfiAAfir 


/ J/U 


35 


GGCAACCAAC 


GTATCAGCAT 


CAGCGCAGGG 


AACAGCTGAT GATACAAACA 


GC!AAAttTAAP 


7380 




ATCGAACGCA 


CCATCTAACA 


AAC CATCTAC 


AGTAGTTTCA 


ACAAAAGTAA 


ACGAAACACG 


7440 


40 


CGACGTAGAT 


ACACAACAAG 


CCTCAACACA 


AAAACCAACT 


CACACAGCAA 


CGTTCAAATT 


7500 


ATCAAATGCT 


AAAACAGCAT 


CACTTTCACC 


ACGAATGTTT 


GCTGCTAATG 


CACCACAAAC 


7560 




AACAACACAT 


AAAATATTAC 


ATACAAATGA 


TATCCATGGC 


CGACTAGCCG 


AAGAAAAAGG 


7620 


45 


GCGTGTCATC 


GGTATGGCTA 


AATTAAAAAC 


AGTAAAAGAA 


CAAGAAAAGC 


CTGATTTAAT 


7660 




GTTAGACGCA 


GGAGACGCCT 


TCCAAGGTTT 


ACCACTTTCA 


AACCAGTCTA 


AAGGTGAAGA 


7740 




AATGGCTAAA 


GCAATGAATG 


CAGTAGGTTA 


TGATGCTATG 


GCAGTCGGTA 


AC CATGAATT 


7800 


50 


TGACTTTGGA 


TACGATCAGT 


TGAAAAAGTT 


AGAGGGTATG 


TTAGACTTCC 


CGATGCTAAG 


7B60 




TAcTAACGTT 


TATAAAGATG 


GAAAACGCGC 


GTTTAAGCCT 


TCAACGATTG 


TAACAAAAAA 


7920 



55 
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10 



1$ 



20 



TGAAGGCATT AAAGGCGTTG AATTTAGAOA TCCATTACAA AGTGTOACAG CGGAAATGAT 8040 

GCGTATTTAT AAAGACGTAG ATACATTTGT TGTTATATCA CATTTAGGAA TTGATCCTTC 8100 

AACACAAGAA ACATGGCGTG GTGATTACTT AGTGAAACAA TTAAGTCAAA ATCCACAATT 8160 

GAAGAAACGT ATTACAGTTA TTGATGGTCA TTCACATACA GTACTTCAAA ATGGTCAAAT 8220 

TTATAACAAT GATGCATTGG CACAAACAGG TACAGCACTT GCGAATATCG GTAAGATTAC 82 80 

ATTTAATTAT CGCAATGGAG AGGTATCGAA TATTAAACCG TCATTGATTA ATGTTAAAGA 8340 

CGTTGAAAAT GTAACACCGA ACAAAGCATT AGCTGAACAA ATTAATCAAG CTGATCAAAC 8400 

ATTTAGAGCA CAAACTGCAG AGGTAATTAT TCCAAACAAT ACCATTGATT TCAAAGGAGA 8460 

AAGAGATGAC GTTAGAACGC GTGAAACAAA TTTAGGAAAC GCGATTGCAG ATGCTATGGA 8520 

AGCGTATGGC GTTAAGAATT TCTCTAAAAA GACTGACTTT GCCGTGACAA ATGGTGGAGG 8580 

TATTCGTGCC TCTATCGCAA AAGGTAAGGT GACACGCTAT GATTTAATCT CAGTATTACC 864 0 

ATTTGGAAAT ACGATTGCGC AAATTGATGT AAAAGGTTCA GACGTCTGGA CGGCTTTCGA 8700 

ACATAGTTTA GGCGCACCAA CAACACAAAA GGACGGTAAG ACAGTGTTAA CAGCGAATGG 8760 

25 CGGTTTACTA CATATC T CTG ATTCAATCCG TG TTT ACT AT GATATAAATA AACCGTCTGG 8 820 

CAAACGAATT AATGCTATTC AAATTTTAAA TAAAGAGACA GGTAAGTTTG AAAATATTGA 88 80 

TTTAAAACGT G TAT AT CAC G TAACGATGAA TGACTTCACA GCATCAGGTG GCGACGGATA 8 94 0 

30 TAGTATGTTC GGTGGTC CT A GAGAAGAAGG TATTTCATTA GATCAAGTAC TAGCAAGTTA 9000 

TTTAAAAACA GCTAACTTAG CTAAGTATGA TACGACAGAA CCACAACGTA TGTTATTAGG 9060 

TAAACCAGCA GTAAGTGAAC AACCAGCTAA AGGACAACAA GGTAGCAAAG GTAGTAAGTC 9120 

TGGTAAAGAT ACACAACCAA TTGGTGACGA CAAAGTGATG GATCCAGCGA AAAAACCAGC 9180 

TCCAGGTAAA GTTGTATTGT TgtAGCGCAT AGAGGAACTG TTAGTAGCGG TACAGAAGGT 9240 

TCTGGTCGCA CAATAGAAGG AGCTACTGTA TCAAGCAAGA GTGGGAAACA ATTGGCTAGA 9300 

ATGTCAGTGC CTAAAGGTAG CGCGCATGAG AAACAGTTAT TTCATAATCA ACAGTCATTG 9360 

ACGTAGCTAA GTAATGATAA ATAATCATAA ATAAAATTAC AGATATTGAC AAAAAATAGT 94 20 

AAATA 9425 
(2) INFORMATION FOR SEQ ID NO: 88: 
(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 38 86 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



55 



35 



45 
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SEQUENCE DESCRIPTION: 


SEQ ID NO: 


88: 








AGTTGTAATG 


TCACATTTCC 


AGAGTCTGAA ATTATCTTTA TCACGTTACA 


TTTACTAGGC 


60 


5 


TCTAAAATGA 


CTGAACATAC 


AGCATCTTCA ATTACCTTTG AATACCATGA 


X X X ATCGCAA 


120 




AATATACATG 


AATTGATCAC 


TTGTGTTAGC 


CAAGAATTAG 


GCATTGATAT 


/"*rr*r* A A A A i*> A 

GTCAAAAGAC 


180 




AACAAGTTAC 


ATACCAGTCT 


GATCACACAT 


ATCAAACCAG 


CTATACATCG 


TATTAAATAC 


240 


10 




AACCTAATCC 


TTTGAGGCAA 


GAAGTT ATG C 


GTCGCTATCC 


TCAAATCATT 


300 






GCAAGCATAT 


TAGTCCAATT 

x nu x v w/irv x x 


GAACAAGATG 


V* x Vjv> ini X \vV3 


CTTCAACGAA 


360 


IS 


GATGAAl iAA 


CATACATTAC 


a a ^*^p/** A ^»^p^p« 

«n X X ± L\~ 


fiPaTPH A i^rp* 
uUil wwiul/i 


lAunuUu X\» 1 


TGCAACACAT 


420 


AAA ^ A A A A 

AAACAATCAA 


TGATTAAGGT 


XuXlvX XALlii 


X\» ivjo 1 1\- lA» 


IjTATAGvvWtC 


GTCACAACTT 


480 




TTAAAATCAA 


AACTAAATCA 


\-V- X\» 1A1 1 


VjauiiUCACA 


TTTGGGAtGc 


CTATTcCATT 


540 


20 


TaTcAATTGG 


aAGaAAGTCG 


Aliwil A qwiv^r' A A 

ATTATTGCAA 


GATAACATTG 


ATT ATGT CAT 


TTCAACAGTA 


600 




CCTTGTGAAA 


TATCAGCTGT 


ACCAGTTATT 


CATGTCGATC 


CATTTATCAA 


TCAACAATCT 


660 




CGTCAAAAAT 


TGAATCAAAT 


TAT CAATGAC 


TCAAGAGAAC 


AACGAGTCAT 


GAAAATGGCA 


720 


25 


ACTGATGGCA AGTCACTCGC 


AGATTTATTG 


CCTGAACATC 


G CATCATTAT 


AAATAAACAA 


780 




CCATTATCAA 


TTGAATCCGC 


AATTGCAGTG 


G CTGTG CAAC 


CTTTAATCAA 


TGATGGCATT 


840 




GTCTATTCAA 


ATTATACAGC 


TGCAATTTTA 


A; A A O A A ' 1 " 1 "IV 

AAACAA1 1 l\J 


A A A A mm/^^ /"^ 

AACAATTCGG 


GTCATATATG 


900 


30 


GTCATTAGTC 


CACATATTGC 


a /™^r*T* & "i^i a ^ * 
r\\~ 1 MX 1 VJ/\\~ 




A. T*P A TV* T* A. JA 

AX XAlxLsXAl-A . 


GAATGGTGTA 


960 




GGTTTCGCAC 


TAACATATTT 




AX IaIUX IIVj 


t» X AL> X AAAtat, 


TAACGATCCC 


102O 




GTTCACCTTG 


TAATTACATT 






*_rtA_4-lx X X nnn . 


GGCATTGGGA 


1080 


35 


CAGTTAAGCG 


AATGCTTAAG 


CAACGACTTA 


TATCGACAAG 


t l u i J i'/ "I'M'A,^ A. 


TGGGAATATT 


1140 




TTTJ^AATTA 


AACAACACAT 


TGCTTTAACT 


ATGACAAAGG 


AGCfTTAATA 


ACGTGTCATT 


1200 


40 


AGACATTTTG 


TCAACAACAC 


GCATCATTGT 


AAAAGAACAA 


GTAAATGATT 


GGACTGAAGC 


1260 


TATAACTATA 


GCTTCTCAGC 


CATTACTACA 


AGAACAAATT 


ATTGAACAAG 


GCTATGTTCA 


1320 




AGCAATGATT 


GATAGCGTTA 


ATGAACTTGG 


ACCTTATATC 


GTTATCGCAC 


CTGAAATTGC 


1380 


45 


AATTGCACAT 


GCAAGACCGA 


ACAATGACGT 


ACATCAAGTT 


GGTTTAAGTC 


TATTAAAGTT 


1440 




GAATCAACAT 


GTGGCATTTT 


GTGATGAAGA 


TCACTACGCA 


TCTCTCATTT 


TTGTATTGAG 


1500 




TGCCATCGAC 


AATCATTCAC 


ACTTATCTGT 


ATTACAAAAT 


TTAGCAACCG 


TACTGGGCGA 


1560 


SO 


TAACCAAACA 


GTCCAGCAAC 


TATTAACTGC 


AACAAATGCA 


CAAGACATTA 


AAAACATTTT 


1620 




AAAGG AG CAT 


GATTAATATG 


AAAATTTTAG 


TAGTATGTGG 


CCACGGTTTA 


GGAAGTAGTT 


1680 



SS 
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AAGTTGAACA 


, TAGTGACATT 


1 ATGACAGCAA 


> GTCCAGAGAT 


GGCTGACTTG 


TTTATTTGTG 


1800 




GTAGAGATTT 


1 AGCTGAAAAT 


GCCGAACGTC 


TAGGGGATGT 


CTTAGTTCTT 


GATAATATTT 


1860 


5 


TAG AT AAAG C 


TGAATTACAA 


CAAAAGCTCT 


CAGAAAAATT 


ACAACAACTT 


AACATGATTT . 


1920 




AAAGGAGGTA 


CGACCTATGC 


AAGCAATCCT 


TAATTTTATA 


GTCGATATTT 


TAAGTCAACC 


1980 


10 


AGCCATTCTT 


GTTGCACTGA 


TTGCCTTTAT 


AGGTTTAATC 


GTTCAGAAAA 


AACCTGCCGC 


2040 


AACGATCACT 


TCAGGAACCA 


TTAAAACGAT 


ATTAGGCTTC 


TTAATTTTAA 


GTGCAGGTGC 


2100 




TGATGTCGTC 


GTTCGATCTC 


TTGAACCATT 


CGGCAAAATA 


TTCCAACACG 


CATTTGGTGT 


2160 


1S 


GCAAGGTATC 


GTACCTAACA 


ACGAAGCTAT 


CGTCTCACTA 


GCCTTAAAAG 


ATTTTGGAAC 


2220 




AACAGCTGCA 


CTCATCATGG 


TCTGTGGCAT 


GATTGTTAAT 


ATTTTAATTG 


CCCGCTTCAC 


2280 




TAATTTAAAA 


TATATCTTTT 


TAACAGGTCA 


TCATACATTT 


TACATGGCTG 


CGTTTTTAGC 


2340 


20 


AATCATTTTA 


ACAGTCAGTC 


ATATTAAAGG 


CTGGCTAACG 


ATTGTTATCG 


GCGCACTCGT 


2400 




ATTAGGATTA 


ATCATGGCAG 


TATTACCTGC 


ATTACTCCAA 


CCTACGATGC 


GAAAAATTAC 


2460 




AGGGAATGAC 


CAAGTAGCTT 


TAGGTCATTT 


TGGCTCAATC 


AGTTACTTTG 


CCGCAGTGCT 


2520 


25 


GTAGGTCAAT 


TATTCAAAGG 


TAAGTCTAAA 


TCAACGGAAG 


AGATTAAATT 


TCCAAAAGGC 


25B0 




TTAAGTTTCT 


TACGAGAAAG 


TACAATTAGT 


ATCTCGATTA 


CGATGGCATT 


ACTTTACTTC 


2640 


30 


ATCGCATGCT 


TATTTGCGGG 


CGTTAG TTAT 


GTACACGAAT 


CTATTAGTGA 


TGGTCAAAAC 


2700 


TTTATTGTCT 


TTTCATTAAT 


TCAAGGTGTG 


ACATTTGCTG 


CTGGTGTATT 


TATTATTTTA 


2760 




ACGGGCGTTC 


GTTTAATCTT 


AGCTGAAATC 


GTCCCAGCAT 


TTAAAGGAAT 


TTCTGAAAAG 


2820 


35 


CTTGTACCAA 


ATTCTAAACC 


TGCATTAGAC 


TGCCCTATTG 


TGTTCCCTTA 


TGCACAAAAT 


2860 


GCAGTATTAA 


TTGGATTCTT 


TGTCAG CTTT 


ATTAGAGGTG 


TCATCGGTAT 


GTTTATCTTA 


2940 




TTCTTATTTG 


GTGGCGTCGT 


CATTTTACCT 


GGCGTAGTTG 


CACACTTCTT 


CTTAGGTGCA 


3000 


40 


ACGGCTGCTG 


TATTCGGTAA 


TGCAAGAGGC 


GGTATTAAAG 


GTGCTATTGc 


TGGCG CCGCT 


3060 




CTAAATGGTA 


TCCTAATCAC 


GTTTTTACCA 


TTATTATTCT 


tgccattttt 


AGGCGAATTA 


3120 




GGTGGTGCTG 


CAACAACATT 


CTCAGATACA 


GACTTTTTAG 


CTGTCGGTAT 


CGTGTTCGGT 


3180 


45 


AACGCAGTAA 


AATATATGGG 


ATTATTTGGT 


GCGATTCTAT 


TTATTATTAT 


CGTAGGTGCG 


3240 




ACAACAATTT 


TATTAAAAGG 


CCGTCAAAAA 


GAACAGCAAT 


AGTGTTAACG 


TAGAAATATA 


3300 




AAACACCGTC 


ACATATTGAG 


TGAATG CCCC 


TTTtATCAAG 


AGGAAAGCCA 


CTTACTTATG 


3360 


SO 


GACGGTGTTT 


TGTATTATAT 


TAAATGATAC 


TTAGCCATAC 


TATCGACAGC 


TGCTAAAATT 


3420 




GCTTCTTCTT 


GTGTCGCAAT 


CGGTTCCCAA 


CCAAGTAATG TTTTTgCACG TTCGTTACTT 


3480 
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CCTAGACTCA AAATAAAGTC TGGTAATTTT TTAGTAGAAA CTTTTTGAGC TATTTCAGGT 3600 

CTCTTTTCTT TAATTAATTT TGCAATTTCC AACAAATTAA TTTGTCCATC AGCCGTCGCA 3660 

5 ATAAATCGCT TGC CATTAGC TTOTTCATTT GTCATTGCCA AAATGTGCAG TTCAGCTACG 3720 

TCTCTCACAT CAACAACATT TAACGGAATT TGCGGTACAC GTTTCATTGA ACCATTCAAT 3780 

AAATTTTCTA ATAAATGAAA GCTTCCTGAA ACGTGTGCAT CTAATGATGG CCCAAAAATT 3840 

10 

GCAACTGGAT TGATTGTGGC AAATTCTACT GTTGTATTTT CATTCT 3 886 

(2) INFORMATION FOR SEQ ID NO: 89: 

(i) SEQUENCE CHARACTERISTICS: 
1S (A) LENGTH: 4879 base pairs 

<B> TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 



20 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 89: 





GTCATCTATC 


AAAAATTTGG 


TATACAGACC 


GACAATTATT 


AATTAATAAT 


TTAATTTCCC 


60 


25 


AGGCAATACC 


AGTGATTAAA 


TATCCACAAA 


TACAACATAA 


AGAACAACCA 


TTAGAATCTA 


120 




TTTCACAACT 


TATATTGTCT 


AAGATGACAT 


CTAATCAATA 


GTGTTTAAAT 


TTCTCAGTGG 


180 




CTGTGAATGA 


GGTTTAAAAG 


TACTATAAAA 


CGTAAACTTT 


GATACTTTAA 


AATACGCAAA 


240 


30 


AAACGGTAAA 


CCCTAATTCA 


TATTATAGAG 


TTTACCGTTT 


TATTTTTTAA 


CTTGCATCAT 


300 




AGTTATATTA 


ACATTATTGT 


TGGTAGTTTG 


GATCAGTAAC 


CATTGCTTGT 


CCAGTATAAT 


360 




CAACCGTTAC 


AATTGAATAT 


TTTCCaTTTG 


CATTTGGGTC 


TTTAAAACTA 


AACACATACT 


420 


35 


TATAGTTGCC 


ATTATGTTCT 


TCAATAGAAT 


AATCATTATA 


CACTTTATTA 


TTACTACCAA 


480 




ATTTfiTTTGC 


TTCATTATTA 


GCCGCATTTA 


AAGCTGTTTG 


GAAATTTGGC 


AATTGCTGTA 


540 


40 


AAGCTTGATT 


TTTATTTCCA 


TTAAACGGAT 


AAATTTGACG 


TGCAACCGGC 


GCGGCATTTT 


600 


GnCCATAATA 


TGGTGCAACG 


TAACTTGATT 


TTTGATTATT 


ATTCGCTTGG 


TTATTACTTG 


660 




ATTGGTTATT 


ATTTGTTTGG 


TTTTGGTCAT 


TGTTTGTTGC 


ATTTGAATTA 


GATTGTTGCT 


720 


45 


GGTTATCGTT 


TGCACTATTA 


TCTTTATTAT 


CTTTGTTTAC 


GTCTTTACTA 


TCATCTTTAT 


780 




TATCTTTCTT 


ATCTTTAGAT 


GAATCATTTG 


TTTTTTTATC 


TTGTTGTTCA 


GTTTTCGCTT 


840 




TAT CATCTTT 


TTCTTTATTA 


CCGTCTTTTT 


GTTGGTCACT 


ATCTTGACCA 


CATGCAGCTA 


900 


50 


AAAATAATGA 


TAATGCTAGT 


AACCCTGTAA 


CTAATCTTTT 


CATACATATC 


TCCTCCTATA 


960 




ATTCGATATT 


CATTGAATAA 


TCTTGAAATA 


CATATCTACC 


ATGTGTATCT 


TTTCATGGCT 


1020 
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TAAGGTTCTT TTTATTATAC CCTAATTTTT GTTCATTATT ATTTAATTTT TGTGAATTTT 114 0 

ATGtTTkCTA TAAATTTAAT TATTTTACTT TAACAATTCA TTACGCATTT AGCATTTCAA 1200 

5 GGTATACACA ATATTTATTA CTATGATTTC ATTTTATCTG CTGCAAAAAC AATCATTATA 1260 

ACTCTTTTTC CATAATTAAA TCTGTATCCG TTACATCACC TGTTTGAAAA TGATGTTCAC 1320 

CAACCACTTT AAATCCATGA CGTTTATAAA ATGCTTGAGC ACGAGGATTA TGCTCCCAAA 1380 

10 

CTCCTAGCCA AATTTTATGT TTATTATGTT CTTGAGCAAT TTTTTCGGCC AATTCTATCA 144 0 

ATTGTGAACC TCTTCCGCCA CCTTGAAAGT CTTTCAAAAA ATATATGCGC TGCACTTCTA 1500 

AATAGGTCTC CCCCATTTCT TCAGTTTGAG CACTATTAAT ATTCATCTTT ATATAACCAA 1560 

1$ 

CATTCGCACC ATCTTCTTGa TAAAAATAAT GAAATGAATC TACATGGTTA ATCTCTTGTG 1620 

TAAATTTCTC TACAGTATAA TTGTCTTTAA AAAATTGATC AAAATCTTTG TCATCATAGT 1680 

20 AAGAACCAAA CGTGTCATAA AATGTTCTAG TTGCTAATTC AACTAATTCA CTAGCATTTT 1740 

GTTCTGAAAT TTCTTTGATT ATCCCAGCCA TATAAATCCT CCAATAAACA GTGATCGAAT 1800 

CAAAATATTA CTTATGTTAT TTTTCAGCCA AAACTATTTA AAAATACATT AACACAAATC 1860 

25 AATTACAAAT TGTATTGATT GTGTGTAACA TCAATAAATG ATACATTTAT TCCAGTAAAA 1920 

TGGCCGTATT TTCAAAAGAG AAAAAGAGAG GATGTATCGT TGTGATAGAA ACATTTAAAG 1980 

CGTTTGTAAT TGATAAAGAT GAGAGTGGTA AAGTGACACC AACTTTCAAA CAATTATCGC 2040 

30 CTACTGATTT ACCTAAAGGA GATGTGCTGA TTAAAGTACA TTACTCTGGT ATAAATTATA 2100 

AAGATGCTTT AGCGACTCAA GATCATAATG CAGTCGTAAA ATCGTATCCT ATGATTCCAG 2160 

GAATAGATTT AGCTGGAACA ATTGTTGAAT cCGAAGCACC AGGCTTTGAa AAAGGAGAAC 2220 

35 

AAGTAATTGT AACGAGTTAT GACCTAGGTG TCAGCCATTA TGGCGGTTTT AGTGAATATG 2280 

CGCGTGTAAA ATCAGAATGG ATTATCAAGC TTCCTGATAC TTTAACATTA GAAGAATCAA 2340 

TGATATATGG CACAGCTGGT TATACTGCCG GTTTAGCAAT TGAAAGACTT GAAAAAGTTG 24 00 

40 

GAATGAATAT TGAAGATGGT CCTGTACTCG TTCGCGGTGC TTCAGGTGGT GTCGGTACTT 2460 

TAGCAGTACT CATGCTTAAT GAACTTGGTT ATAAAGTTAT CGCAAGTACA GGTAAACAAG 2520 

ATGTTAG CGA TCAATTACTT GAACTTGGTG CCAAAGAAGT TATCGATCGA CTTCCTGTTG 25 BO 

45 

AAGATGATCA TAAAAAGCCA CTCGCATCAT CAACTTGGCA AGCTTGTGTA GACCCTGTTG 2640 

GTGGCGAAGG TATTAATTAT GTTACAAAGC GTTTAAATCA TAGTGGGTCA ATTACAGTTA 2700 

50 TTGGTATGAC TGCCGGTAAT ACTTATACTA ATTCTGTATT CCCTCACATT TTAAGAGGTG 2760 

TAAACATTTT AGGAATTGAC TCGGTATTTA CTGCTATGAA ATTAAGACAG CGCGTTTGGC 2820 

55 
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TTGATGAACT TCCAOAACAA CTTAACAAAG TAATTAAACA TGAAAATAAA GGGCGCATTG 2940 

TTATCGATTT OGGTGTAGAT AAATAGTATT CATGAAAAAG ACATCCCGTT ATOCGAGATQ 3000 

5 TCTTTTTTAA TTTAGTATTT GATATACATA CCGCCTGAAT CTGGTTCGGT AGOTATAAAT 3060 

CCAAATTTTG TATATAATTT ATCCGCTGGG TAGTCTGCAA TCAGAcTAAC GTATGTACTC 3X20 

TCAACAGCCA CACCTTTAAT ATATTGCATA ATATGCTCCA TAATTAGACT GCCGTAACCT 3180 

W TGACCTTGGT AACTTTTCAA AACTGCAATA TCAACAATTT GAAAAACAGT TCCGCCATCG 3240 

CCAATCACTC TACCCATACC AATTAACCGA TCTTTATCAT ACAAGGTTAC TGTAAATAAG 3300 

GCATTAGGTA ATCCTTTTTC aGCTGTTCGC GCGTCTTTGG ACTCATACCT GCGTTAATCC 3360 

15 

TTAATGCGCA ATAATCCTCG CAAGTCGGAA TATCATATGT CACTTTAACC ATTATTTACC 3420 

CCACTTTTCA TCACACAATA TATCAACCTA GTATAAATGT TTATTTACAA TAGTCTTATT 34 80 

CGCTTCTTTA AACACTTCAT GATGACTTGA AACATAACCC TCTGCATTCG CATCTGGTTG 3540 

20 

GATATATGTT TTAGCAAGGT TCGCTGCATT TGCACCATCA CTAAATGCAC TTGCAATTAG 3600 

ATGTGATTTT GCATCATGAT AAACAATATC TCCACACGCA TAGATACCAG GTATACTAGT 3660 

25 TGTCGTATTA CCAAATCCTT TAACACGACA AT CATCATGC ATATCTAGCT TTGAAGATGT 3720 

TtCACTCAAT AATGTATTAC AACGATCAAA CCCATGACTA ATAATGACAT CGTCAAATTT 37 80 

AACTGTATGC CTATCGCCAC TTTCAACATG TTCCAAAACA ACTTCACTTA TATGCGTTTC 3840 

30 ATCATCATTG CCGACCAAGT ATTTAATACG TGTTTTTGGG CATAGTTTCA CATTTAAATC 3 900 

TGTCACCAAC GTTTTCATCG CTTCATGACC ACTTACATCT TCTTTTCGAT AAACAACTGT 3 960 

CACGCTTTTA GCAATCTTGG CAATATCATG CGCCCAATCT AATGCTGTAT TTCCTCCACC 4 020 

35 TGATATTAAT ACATCTTTAT CTTTGAAACG TCTGTAACTT TGTACAACAT AATGTAAATT 4080 

AGTTSATTGA TATCTCTCTA CACCTTTAAC ATCTAATTGT TTTGGATTAA TAATACCCGC 4140 

ACCAATTGCA ATGATAACTG CTTTCGATGT ATATATTTCT CCCGCTTCTG TTTCAACTTC 4200 

40 

GAAATGACGT TCTGCCTTTT TCCTAATATC TACCACACGT TCATTCAAAT GAACTTCOGG 4260 

TTTAAAATAT AATCCTTGCT TAATTGTATC TTTTAAAATT TCATGACAAG GTTTTGGCGC 4320 

AATGCCGCCA ATATCCCAAA TAATTTTTTC AGGGTAAATT CTCATCTTAC CCCCTAATTC 4380 

45 

AGATTGAACA TCTATCAATC TTACAGACAT ATCTCGCAAT CCAGCATAAA AGCTTGCATA 4 440 

CAAACCAGAC GGACCGCCAC CAATGATTGT AACATCTTTC ATTATGTGCC TCCTATGACT 4 500 

50 CT CT AT ATTC ATTTCTTTCA TTAACGTGCT CAAATTGATA ATTATTATCA TTTAAAGCCA 4 560 

TTATACTATT AATATTTATA TTGTTAAAAT AAATCGCATA GTTAGCCATG AATTATCAAT 4620 
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GAAAGATGTG TATATTTTTT AGTTCTAGTT ATATTATTTT TTAAAAGACT CATCACQTGG 4740 

TTCTTTAAGA ATTGCTTGTC TTAAAAGGAA AAATAGCAAC AATAAACCTG CAAGCATACC 4 800 

TGTGTGCCCA ATACCTGCAA AGCCTGCnAA TGCTTCTGGA GAGTATGATT TACCAGTGAC 4 860 

TTGGAAGAAT CCTTTTGTC 4 879 



(2) INFORMATION FOR SEQ ID NO: 90: 

10 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1560 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

15 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 90: 

20 ATAATGTCTT AGaTTGATTG GGAGTTTTTT TAATTTTTTT GAAATTAAAT TAATCTGTAs 60 

yTAATAAAAA ATTTGAATAA CTGACACAyT TTTTTGATCA TAGCTAyATA CTTTGTGAAT 120 

TAATTCACAT TATAATAAGA GTGAAGATAA GAGTATTATA AATnATCTTT AAATAAATAT 180 

25 ATGTGAAGTA AAAATTACAC GTTAGCATAT CGATTATGgT CATTTCkTTT AACATATTAA 24 0 

CTgGGGaACG TTAAAAGTTA A CGGkTGATA TCyAACtAAA AACAAGGTCA CAGTAGTATG 300 

TTTTAATCTG GCGTCTATTA CAAATAAAAA TTACATCTAT AATTATTCGT TTTCTTTTTT 360 

30 GAAAGTAATA GCCAATTAAT ATCATACATA CTGGAGTGAC TATAAGGAGG ACATTATTAT 420 

GAGAGCAGCA GTTGTAACGA AAGATCACAA AGTAAGTATT GAGGACAAAA AGTTAAGAGC 480 

TTTAAAACCT GGTGAAGCGT TGGTACAAAC GGAATATTGT GGCGTTTGTC ATACCGATTT 54 0 

35 

ACATGTTAAG AATGCTGATT TTGGTGATGT TACAGGCGTT ACTTTAGGTC ATGAAGGTAT 600 

TGG'HVAAGTC ATCGAAGTTG CGGAAGATGT AGAATCATTA AAAATTGGAG ACCGTGTGTC 660 

TATCGCTTGG ATGTTCGAAA GCTGTGGAAG ATGTGAATAT TGTACAACAG GTCGTGAAAC 720 

40 

ACTTTGCCGT AGTGTGAAAA ATGCTGGTTA TACAGTAGAT GGTGCAATGG CTGAACAAGT 780 

TATTGTTACT G CAGACT ATG CTGTGAAAGT ACCTGAAAAA TTAGATCCAG CAGCAGCGTC 840 

4S TTCTATTACA TGCGCAGGTG TGACAACTTA TAAAGCTGTA AAAGTAAGTA ATGTAAAACC 900 

TGGACAATGG TTAGGTGTTT TTGGTATAGG TGGTTTAGGT AACCTAGCTT TACAATATGC 960 

TAAAAACGTT ATGGGGGCTA AAATTGTTGC ' CTTCGACATC AATGATGATA AATTAGCATT 1020 

SO CGCGAAAGAA TTAGGTGCTG ATGCTATTAT TAATTCTAAA GATGTTGATC CAGTTGCAGA 108 0 

AGTTATGAAA TTAACTGATA ACAAAGGATT AGATGCAACA GTGGTAACTT CAGTTGCTAA 114 0 
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TTTACCTGTT GATAAAATGA ACTTAGATAT CCCAAGATtA GTGCTTGATG GTATTGAAGT 1260 

AGTAGGTTCA CTTGTTGGTA CAAGACAAGA CTTACGTGAA GCGTTTGAAT TTGCTGCTGA 1320 

5 

AAATAAAGTA ACACCTAAAG TTCAATTAAG AAAATTAGAA GAAATCAATG ATATTTTTGA 1380 

AGAAATGGAA AATGGTACTA TAACTGGTAG AATGGTTATT AAATTTTAAA AATATCAACT 1440 

GACTATATAG ATAAAGAAGG TAGTGCTCTG AACACTATCA TTATTAATCA AACCCCGAGG 1500 

10 

TTTTCCTGAA AAGATAGTGG nAAATCCCCG TGTTTTTTGG GTTTGAGGnG GTTGTnTGTA 1560 

(2) INFORMATION FOR SEQ ID NO: 91: 

1S (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 11014 base pairs 
(B> TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

20 

<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 91: 



26 



30 



35 



40 



45 



50 



GTCCTGTnGC 


TGCAATGAAT 


ACGCCTAAAA 


ATCCAGGGAT 


GTAATGGATA 


CTTTGTGGTA 


60 


GTACTAATGA 


TAGAAATGAT 


AAAAATGAAA 


TCACAAAGGC 


TACGCTCGCA 


AAAGCTTGAC 


120 


ATGTACGCTT 


ATCGCCATAA 


TCTAACCCTG 


TACGTATATG 


TAATAAATAC 


TGTAATCCGA 


180 


TACTTAAATA 


CATAATTGCC 


ACGCATAAGA 


AGAATGGGAA 


GAATGTCTTT 


TCAAAGTCCG 


240 


GATATAGGCT 


GTTAGATAGG 


AAGACCATGA 


TGAACATATT 


AAACATCATA 


AACGAGACGT 


300 


CTTTGAATGT 


AACTTGACCA 


AATCGATTTG 


TAAAAAATGT 


TTGATGAGAC 


CACATTAACC 


360 


ATAAGAACAA 


ACTCATGACG 


ATGTATTTGA 


AAAATAAATC 


AGCTGAAATG 


GAACCGTTTT 


420 


GTGTTGTTAA 


AATCACATGT 


GCAATTTTTT GAATGGCAT A 


. GACGAAAATT- AAATCAAAGA 


480 


ACAACTCATG GAATCCTGCA 


CGCTTTTCAG 


CTAAATGTTT 


TGGTGTTAAT 


GCATTAACCA 


540 


TAAAATTTTA 


ACTCCTTTAA 


GATGTGTAAT 


TAATTTACTA 


AGTATACTAT 


TTATTriTTC 


600 


TAGTGAATAG 


GGGCAGATTT 


GGCGATGAAG 


TGGAAGGAGA 


GGTGACTGCA 


AGGTAATTGC 


660 


GGAATTAACA 


ATCATCAGCG 


ATTTAATATT 


TGACTGGAGA 


CGTCATGGTA 


ATAAAAAATT 


720 


GATGAGAAAT 


TGATGGTGAA 


ACCAGCTGTG 


AATAsCGaTG 


CAATGATTSA 


TAGaATTTAA 


780 


TTAGAGTCAT 


TACGCGaAAT 


GATTAATGAT 


AATTTGTGGT 


AAATCAAAGC 


aTAATTTTGT 


840 


ACTATAGATG 


AGGATGATAG 


AGCATATTTA 


AGAGGGTGAA 


ATGTTAAAGT 


GAAACCGTTT 


900 


ACGTTTCCGA 


TTGCCCAAAC 


AAATTACATC 


ATTGTATAAT 


atgatttgtt 


AAATGCATAA 


960 


CAAGAATGAA 


AATGTAACAT 


ACGTAGCAAT 


TGGTTTCATA 


AATTGGATGT 


TAGTGGCGTA 


1020 
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TGACGAGAGT CGTATTAGCA GCAGCATACA GGACACCTAT TGGCGTTTTT GGAGGTGCGT 1140 

TTAAAGACGT GCCAGCCTAT GATTTAGGTG CGACTTTAAT AGAACATATT ATTAAAGAGA 1200 

CGGGTTTGAA TCCAAGTGAG ATTGATGAAG TTAT CATCGG TAACGTACTA CAAGGAGGAC 1260 

AAGGACAAAA TCCAGCACGA ATTGCTGCTA TGAAAGGTGG CTTGCCAGAm ACAGTACCTG 1320 

CATTTACGGT GaATAAAGTA TGTGGTTCTG GGTTAAAGTC GATTCAATTA GCATATCAAT 13 8 0 

CTATTGTGAC TGGTGAAAAT GACATCGTGC TAGCTGGCGG TATGGAGAAT ATOTCTCAAT 1440 

CACCAATGCT TGTCAACAAC AGTCGCTTTG GTTTTAAAAT GGGACATCAA TCAATGGTTG 1500 

ATAGCATGGT ATATGATGGT TTAACAGATG TATTTAATCA ATATCATATG GGTATTACTG 1560 

CTGAAAATTT AGTAGAGCAA TATGGTATTT CAAGAGAAGA ACAAGATACA TTTGCTGTAA 1620 

ACTCACAACA AAAAGCAGTA CGTGCACAGC AAAATGGTGA ATTTGATAGT GAAATAGTTC 1680 

20 CAGTATCGAT TCCTCAACGT AAAGGTGAAC CAATCGTAGT CACTAAGGAT GAAGGTGTAC 1740 

GTGAAAATGT ATCAGTCGAA AAATTAAGTC GATTAAGACC AGCTTTCAAA AAAGACGGTA 1800 

CAGTTACAGC AGGTAATGCA TCAGGAATCA ATGATGGTGC TGCGATGATG TTAGTCATGT I860 

25 CAGAAGACAA AGCTAAAGAA TTAAATATCG AACCATTGGC AGTGCTTGAT GGCTTTGGAA 1920 

GTCATGGTGT AGATCCTTCT ATTATGGGTA TTGCACCAGT TGGCGCTGTA GAAAAGGCTT 1980 

TGAAACGTAG TAAAAAAGAA TTAAGCGATA TTGATGTATT TGAATTAAAT GAAGCATTTG 204 0 

30 

CAGCACAATC ATTAGCTGTT GATCgTGAAT TAAAATTACC TCCTGAAAAG GTGAATGTTA 2100 

AAGGTGGCGC TATTGCATTA GGACATCCTA TTGGTG CATC TGGTGCTAGA GTATTAGTGA 2160 

CATTATTGCA TCAACTGAAT GATGAAGTTG AAACTGGTTT AACATCATTG TGTATTGGTG 222 0 

35 

GCGGTCnAAC TATCGCTGCA GTTGTATCAA AGTATAAATA ATAAGAAAAC AGGTTATCAC 2280 

AACA£TATTA ATtACATGTT GGCATAACCT GTTTTTATTT GTTTATGGAT TTATTGGGTA 2 34 0 

ATATTAGTCA TTTGATGGTT TAATTGCAAA TGCTCTAACA GGGAACCCAG GTGCATCTTT 24 00 

40 

TGGTTTAGGG CTGATAGCGT AAATGATGGC GCCACGAGTT GGTAATTGAT CTAAATTAGT 2460 

TAATAACTCG ACTTGGTATT TATCCTGACC AAGAATATAA CGTTCGCCAA CTAAATCACC 2520 

45 ATTTTTTACA ACGTCCACAG ATGCATCGGT ATCGAATGTT TCATGACCAA CAGCTTCAAC 2580 

ACGACGTTCT TCAATTAAGT ACTTCAAAGC ATCTAATCCC CAACCCGGTG CATGTTGTTG 264 0 

TCCGTTCGCA TCTTTGTTTT CAAACTTTTC AATATTAGGC CAACGTTTTG ACCAATCGGT 2700 

60 ACGAAGTGCA ACAAAAGTGC CAGGTTCAAT AGTACCATGC TCTTTTTCCC ATGCTTCTAT 2760 

ATGCGCACGT GTTACGATGA AATCATTGTT GTTCGCTACT TCTGTTGAAA AGTCTAATAC 2 820 
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AAAGTGAATT GGTGCATCAA TGTGAGTACC ATATTGCGTT ACAATATTCC AACGTTGCAC 2 940 

ATAGAAACCA TGATCTTTAA CCGTGAATAA AGTTGAAACT TCGCCTTTTT CAAACTCACT 3000 

5 

AAAACGTGGT ATTTCCGGAT CAAATGTATG CGTTAAATCA ACCCAAGTTG CTTGTTTTAA 306 0 

AGTATTTAAT TGTTGCCATA AAGGATATTG TGTCATAAAA TCACCCGTTT TTAGTTTATT 3120 

ATATGATAAA TGCTGCGATT ATTCTTGGCG TTTAGCTTTA ACAGCATTCA CAAGCACAGT 3180 

10 

CAATGCATCT TTAACTTCTT CTTCTTTTCG CGTTTTTAAA CCACAGTCAG GGTTTACCCA 3240 

GAATAATGAG CGGTCGATTT GTTGTAGTGA ACGATTGATT GCTGTAGTAA TTTCTTCTTT 3300 

1S TGTTGGAATA CGTGGACTAT GAATATCATA TACACCTAGA CCAATACCTA AATCATAATT 3360 

AATATCTTCA AAGTCTTTAA TTAAATCACC ATGGCTACGA GATGTTTCAA TTGAAATAAC 3420 

ATCAGCATCT AAGTCATGAA TAGCATGAAT GATTTGACCG AATTGAGAAT AACACATATG 34 80 

20 TGTATGGATT TGAGTTTCAT CACGAACTGA AGACGTTGCA AGTTTAAATG ATAAAACAGC 3540 

ATCTTTAAGA TATTGTTCGT GATATTCAGA GCGTAATGGT AAGCCTTCAC GTAATGCAGG 3600 

TTCGTCAACT TGGATAACTT TGATTCCTGC AGCTTCAAGT GCTAATACTT CTTCGTTGAT 3660 

25 TGCTAAAGCA ATTTGATCTT GAAOGACTTT ACGTGGTAAA TCAACACGTT CAAATGACCA 3720 

GTTTAGAATT GTTACAGGTC CAGTTAACAT ACCTTTAACT GGTTTATCTG TTAAGCTTTG 3780 

TGCATAAACT GTTTCATCAA CAGTTAAAGG CGCTGTCCAT TTTACATCAC CATAAATGAT 3840 

30 TGGTGGTTTT ACGGCACGTG AACCATATGA TTGCACCCAA GCGAATTTAG TTACTAAGAA 3900 

ACCTTGTAAT TTTTCTCCGA AGAATTCAAC CATGTCATTA CGTTCAAATT CACCGTGAAC 3960 

TAATACATCT AAGCCAATGT CTTCTTGAAT TTTAATCGAT GGAGCAATTT CATTTTTTAA 4020 

35 

GAATGTTTCA TATGCTTCGT CTGTAATGCG TTTGTTCTTC CAATCTGCAC GGTATTTTCG 4080 

AACTTCTCGG CTtTGTGGGA ATGATCCAAT AGTTGTTGTT GGTAAATCCG GTAAGTTCAA 4140 

ACGTTTTTGT TGTTGTTCAA TACGTTGCGC GAATGGTGAT TGTCTTGAAG TACGCACGCT 4200 

40 

TTCGAAATCA TAATCTAAGT TTTTGAATGA TTGATTTTGG AAACGCTCAT AACGTGCTTT 4260 

TAATTTATCA TATTTAACAC TATCGTTTTG ATTAAATAGG CGACGCAATG CATCTAATTC 4320 

45 GTCTAATTTT TCAGTTGCAA AGCTTAAGCC TTCGCCAACA CTTGTATCTA ATGTTTCATC 4380 

ATCTAAAGAT ACTGGAACAT GTAATAATGA AGATGATGGT TGAATGACAA GTTCATTAGT 444 0 

GTGTGCTAAC AATTTATCGA TTAAGACTTT TTTAGCTTCA ATGTCACTTG CCCATACATT 4500 

SO ACGACCATCA ATAATTCCAG CGTATAATGT TTTTGATTTA TCAAAATCTC CAGCTTCAAT 4 560 

TTGTTTAAGG TT AT AG C CAT TATCATGGAC AAAGTCTAAA CCTATACCAC CAACAGGTAA 4620 
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AACACCAGCT TTTTCGAAAT AGTCATAAGC TTCACGTGTA AT ATTTT CAT AGCTTTCGCT 474 0 

GTCGTCTGTA ACTAAGATTG GCTCATCAAC TTGAATGTAC TCAGCACCTG CATCAATTAA 4800 

TGATTCAAAC ACTTCTTTAT AAAGTGGTAA TAACGTTTTA ACTTTTTCTT CAAAAGTTTG 4 860 

GTGACCGCCT TTTGATAATT TAACAAAAGT AATCGGACCA ACAATGACAO GGTGAGCGTT 4920 

AACGTTTAAA GATTGGGCAT ATTTAAAGCG ATCTAATAAT ACATTGCGAC TCACTTTAGG 4 980 

CTCAACATTG TCCCATTCAG GTACGATGTA ATGATAGTTA GTGTTAAACC ATTTTATAAG 5040 

TGCACTTGCA ACATGGTCTT TATTACCGCG AG CAATATCA AATAATAAAT CATCATCAAT 5100 

AGTTCTT CCT TGGAAACGTT CAGGGATGAT GTTGAATAAT AATGACGTAT CTAATATATG 5160 

GTCATATAAA GAGAAATCAC CAACTGGGAT GCTATCTAAG TGATAGTACT TTTGtAATAA 5220 

TAAATTTyCT TTATGTAGAT CAGTTAATGT TTGATCTAAT TCTTCTTTAG AAATCTTCTT 5280 

20 TGCCCAATAA CTTTCGATGG CTTTTTTCCA TTCTCTTTTT CTACCTAATC TTGGGAATCC 534 0 

TAAGTTTGAT GTTTTAATTG TTGTCATAAT ATTG CCTCCT TGTGAGCAGT AATAGATTTT, 5400 

GAGTATGCTG CAAGTTCTAA TGAATCTTCG ACATTTTGAA ACGGTGTGAT AATGTATAAA 5460 

25 CCATTAAAAT ATTCATGAAC AGTATCGATT AAATCCTTTG AAAGCTTAAG ACTTAGTTCT 5520 

CGTGTTTTGG CTTTAT CATC TTTAACTGCT TCAAATTGTT GTAAAATTTC ATCTGACATC 5580 

TTGATTCCTG GCACTTCATT ATGCAAAAAG AGTGCGTTTT TGTAACTTGC G AT AGG CAT A 564 0 

ATGCCTATGA AAAATGGTTT GTTCAAGTGC TTAGTGGCAT GGTAAATTTC AATGATTTTC 5700 

TCTTTGCTGT ACACGGGTTG TGTTATAAAA TAAGACATTC CGCTTTCTAT CTTTTTCTCT 5760 

AATCTTTTGA CGGCAC CATA TAATTTACGA ACATTAGGGT TAAAGGCGCC Ag cGATGTTG 5820 

AAGTGTGTAC GTTTCTTCAG CGCATCACCG TCAGTGTTAA TACCTTGATT AAATCTTAGA 5880 

GCGAGTTCAG TTAATCCTTT AGAATTAACA TCATAGACAT TGGTTGCACC TGGTAAGTGA 594 0 

CCAACTTTTG AAGGATCACC AGTTATGGCT AATATTTCGT TAACG CCAAT GAGCGATAAT 6000 

CCAAGTAAAT GGGACTGCAA GCCGATTAAG TTTCGGTCTC GACATGTAAT ATGTACGAGT 6060 

GGTTCAATAT TGTAATATTG CTTAATTAAG CTAGCAGCAG CAATATTGCT AATTCTGACA 6120 

4 $ GTTGCCAATG AATTATCTGC GAGTGTTACC GCATCTACAT TAGCTTTATC AAGTTTAGCG 6180 

AT ATTTT CAA AAAATCTATC CGTGTCTAAA TGTTTCGGTG TATCCAATTC GATAATAACG 6240 

GTTGGACGTT CTTGAACCTT AGATGTTAAT GATTGTCTAA CTTTATTTTG AGATGGATTG 63 00 

50 AAAAGTGCTT TCGTTGGTAT CGGAATCACT TTTTTGTCAT TAACAGGTTT AAGTGTCTGA 6360 

AT AG ATT CTT TAATAAATTT GATGTG CTCT GGCGTTGTAC CACAGCAACC ACCAATTAAA 6420 
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TACTTAAATT CACTATTTTC AATATCTAAT AAGCTGGCAT TTGGATAACA AGATAAGAAT 6540 

GCGTCCTCTG GTAATTCAAT ATQTGTGAAA GACTCTTGCA TATGGTGCGO GCCATGATGA 6600 

5 CAATTGAGTC CCACGATGTT TGCACCACAT TGAACGAGTT GTTTTAATCC TTCATTGATT 6660 

GCCTCACCAT TAACTAAGTA ATTTGTGTTT GAAGCGGTTA ATTGAGCAAT GATTGGAATG 6720 

TCGTATTTCT TTCTCGTTCG TGAAATGACA TTTGTTAACT CTTCTAGGTC GTAATACGTT 6780 

10 

TCGAAAAGTA GCGCGTCAAC GCCTTCTTCA ATTAAGGTGT CTATTTGAAT TTCAGTATGA 6840 

TAAAGAATAG TTTGTAAGCT GATATCCTCT TGTTTGATAC CTCTAAACCC ACCAACTGTG 6900 

^ CCTAATATAT ACGTATCTTT ATTTGCTGCT TTTTTTGCGA TGCGAACX3GC GGCTTGATGT 6960 

ATTGCTTTAA CTTTATCTTC AAGACCGAAT CGTTTTAACT TTTCAAAATT TGCACCATAA 7020 

GTATTGGTTT GAATGACATC AGCACCGGCT TCAATATATG AACGATGGAT GCGTTCAACT 7080 

20 TTATCTGGAT GGCTAAGATT ATATGCTTCT GGACAGGTGT CTAATCCTTC AGAGTATAAA 7140 

ATGGTTCCTA TAGCGCCATC AGCTACTAAA ACATTATCTT TCAATTGTGT GAGGAATTGA 7200 

CTCATTGAAT GCCTCCTTTA ATGCGTATTT GATGTCTGCA ATGAGTTCAT CAGGATCTTC 7260 

25 GAGACCAACA CTTAATCGGA ATAGACCGAA AGTGATACCA CGTTCTTGTC TCACTTCTTC 7320 

AGGTAGTGCA GCGTGAGACA TTGTTGCTGG ATGTGAAAGG ATCGTTTCAA CACCGCCCAG 7380 

ACTCACTGAA ACGAGTGGTA ATGTCAGTGC ATCGACAAAT TGTTGTGCTT TAGACTCATC 7440 

AGCTAAACGA AAGCCAATAA CGGCACCGCC ATTTTTAGCT TGTTCTAAAT GAGCAGTAGT 7500 

GAGTCCCGGA TAATAAACTT CTGAAATTTC ATCTTGCTTT ATTAAAAATG ACACGATTTT 7560 

TTGAGCGTTT TCGACAGATT GTTTAAATCT GATTGGAAAA GTTTTTAAAT GTTTAGCAAG 7620 

3S 

TGTCCAGCTA TCCTGAGCAG ATAACATATT GCCTGTACCA TTTTGTATTA. AATAAAGAGC 7680 

GTC?£tAATT GCCTCATTAT TAGTTATGAC AGCACCAGCA ATTAAATCGC TATGTCCACT 774 0 

TAAAAATTTT GTAGCACTAT GAATGACAAT ATCAGCGCCA AGTAATAAAG GTGATTGACc 7800 

40 

TAACGGTGTC ATAAATGTAT TGTCCACAGC TACCAGTAGT TCATGCTTTT CGGCTATTTT 7860 

AGAAACAGCT TTGATATCAG TAATTTTAAA ACAGGGATTC GATGGTGTTT CGATATAAAT 7920 

45 TAATTTTGTG TTTGATTGAA TGGCACCCTC GATTTGTTCG AGCTTTGTAG TATCTACGGT 7980 

TGTAAATTCA ATATTAAATC GATTCAAAAT TTGCTCAGTG AGGCGAAAAG TACCG CCATA 804 0 

TACATCATCG GGTAAGATGA CATGATCACC AGATTTGAAA GTCAAAAGTA CTGCTGAAAT 8100 

50 AG CAGCAAT A CCTGATGCAA AAGCAAAAGC GAATTTTCCC TGTTCTAATC GTGCTAACTT 8160 

CTCTTCTAAA AGTTCACGGT TAGGGTTGCC cTTCGTGCAT AATCATATTT AACATCGCCA 8220 
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w 



TCCACACCTC TACGCCAATC GAATATCACT TCTGTCTCTT TTGAAAGTGT CATACAATCT 8340 

CTCCAATCTG AGCTTTATCT AATGCTTGGA TGATATCGCG TTCGATGTCT TCATAATTTT 8400 

CAACACCTAG TGATAAGCGG ATTAAATACT CATCAATGCC ACGTTTATCT TTTTCAGCAT 8460 

CTGGCATATC AACATGTGTT TGGGTGTAAG GGAAGGTCAC TAATGTTTCA GTACCTCCTA 8520 

AACTTTCTGC AAAAATGCAA ATGTCTAAAT TTTCTAATAA TTTAGCGACQ CTATAGGCCT 8580 

TGTTAAGTCT TAAACTAAGC ATGCCAGTTT GCCCGCTATA TAGTACTTCG TCAATTGCTT 864 0 

GAAGTGACTG ACATTTTTTA GCAAGTTTTC TAGCGTTTGA TTGCGCACGC TCAATGCGTA 8700 

15 AATGCAAAGT TTTAAGTCCA CGTAACAACA AATAACTATC TATTGGTGAA AGTGTTGCGC 8760 

CAGTCATGTT GTGAAAATCA AACAACTGTT GCGCGAGTGA TTCATCTTTG ACGGTTACGA 8820 

CACCTGCTAG TACATCGTTA TGTCCGCCAA TATATTTCGT GGCTGAATGT AAGACTATAT 888 0 

20 CAGCACCTTC TGCTAGTGGT GTTGAAAGAT AAGGTGTTAA AAAAGTATTQ TOGATAATTG 8940 

ACAATAAGCC TTT AG CTTT A CAAAGTTGAT AGTATGGCTT TACATCAATA GCAATCATTT 9000 

GTGGGTTAGA TATTGGTTCA ATGAATAATG CAACTGTTTT ATCAGTGATT TCTTTTTCAA 9060 

25 CTTGTTCATA ATCTGTAAAA TCAACGTACT TAAATTTGAT ATCGTATTGT TGCTCGTAAA 9120 

ATTCAAATAA TCTAAATGTG CCACCATATA AATCGAATGA AACTAAAATT TCATCATGAG 9180 

GTTTAAATAG ATTACATATT AATTGAATGG CTGACATTCC ACTTGATGTA GCGAATGATG 924 0 

CAATACCATG CTCAAGTTTG GCAAAACAGG TTTCAAATGT TGAGCGTGTA GGATTTTTAG 93 00 

TACGTGTATA ATCAAAA CCT GTCGATTGTC CTAGTTTTGG ATGCTTGTAG GCAGTAGATA 936 0 

AATGGATTGG ATTCG CTATA GCACCGGTTG AATCATCGGT TAATGTGATT TGGGCTAACT 942 0 

GTGTATCCTT CATATTAAGA CCCTCCTATA AGAAAAAATA AAAAAAGCTT CCGTCCTTCG 9480 

TACCCGAATG AATCGGATAA AAAGGACGAA AGCTTATGTT TCGCGGTACC ACCTTTATTT 954 0 

GTTATTCCAT CGCTGAAATA ACCTTATTCA GTACGCATTA AAAGTAAATA TGCTTACTGA 9600 

ACAATTATCA CAATTAAAGT CAGTAAGTAA GGATATAGTA ATGTG CTATC CCATACTTAT 9660 

TAACAAAAAA TCGTGCGTAA AGAATCCAGT ACGCCATTTA ACATCAATGT TAATACTGTA 9720 

45 TCG CTATAAC GGGCGAAC CC GTAGACACCT CATATTGGCA TCAACACTCC AAGGCCATTT 9780 

TCAAACACGC TTTCAAAATC TTCTCTCAGC TACTAAAGAC TCTCTGTATA AGCAGGGTGT 984 0 

GTTTTACTTy CCTCTTTATT GTGTTTACGT TTCATTAAAC TGTTATAAGA TATTAATTAG 9900 

60 CTTACAGAGT AAAAAAAGAT TTGTCAACAA TTATTCAGAA AATTTTGATT TAAAAGTTAA 9960 

TTTGTTTGTG AAATTGTAAT TGGTATCTTG AAGTTGAAAA ATGAATTATT TTTTAAATAA 10020 
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10 



1$ 



20 



25 



35 



TCAAATAAAA AGTGATGTGA GTGAATTGTC AAAAAGTGAA GATCAACGTA TTACTAAAAC 10140 

AAAAGATGAA CAAATTAAGC AAATAGATAT ATCGGATATC AAACCGAATC CGTATCAGCC 10200 

CCGAAAAACT TTCGATGAAA ATCATTTAAA TGATTTGGCA GATTCAATTA AGCAATATGG 10260 

AATTTTGCAA CCAATTGTGC TTAGAAAAAC AGTTCAAGGT TATTACATTO TAGTTGGTOA 10320 

AAGAAGGTTT AGAGCTTCGA AAATTGCTGG TCTAAAATAC GTATCAGCGA TTATCAAAGA 10380 

TTTAACAGAT GAAGATATGA TGGAACTGGC GGTCATCGAA AATTTACAAC GAGAAGACTT 10440 

AAATGCGATT GAAGAAGCTG AAAGTTATCA ACGTTTGATG ACAGATTTGA AAATTACACA 10500 

ACAAGAAGTA GCGAAACGAT TGAGTAAGTC GCGCCCGTAT ATAGCGAATA TGTTGAGGTT 10560 

ATTACATTTG CCGAAAAAGA TTGCTGACAT GGTAAAAGAT GGGCGACTGA CAAGTGCACA 10620 

TGGACGAACG TTATTGGCAA TTAAAGATGA ACAACAAATG CTTAGGTTAG OGAAACGGGT 10680 

TGTTAAAGAA AAGTGGAGTG TCAGATATTT AGAAAACCAT GTTAATGAAT TAAAAAATGT 10740 

TTOGTCAAAG TCGGAAACAG ACAAAGTAGA TATAACTAAG CCTAAATTTA TAAAGCAGCA 10800 

AGAACGACAG TTGCGAGAAC AGTATGGTAC CAAAGTAGAT ATATCAATAA AAAAATCGGT 10860 

TGGTAAAATC TCATTTGAGT TTGATTCACA AGAAGATTTT GTGAGAATAA TTGAACAATT 10920 

AAATCGTAGG TATGGTAAAT AGTTACACAA TTTTATATAA TAACTCTTTG TGCAAGTGTA 10980 

AATAAATTGT AATCAGTGAC ATTTGATTCT AGAT 11014 
(2) INFORMATION FOR SEQ ID NO: 92: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 6022 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 



40 



so 



' <xi) SEQUENCE DESCRIPTION: SEQ ID NO: 92: 

TCCCCTTATG GAATTTCACA TTCTAGTTTA CATAATATAT ATTATAGGAA GTTATATGTG 60 

TGTAACGCAA AAgGTACCCT ACATCATAAT CATTATCTAA TATCGTCACA TAACTTACTT 120 

ATGCTATAAT CATGGTATTA TATTGTTTGG AGTGATTTGA TGAGATTTGT CTTTGATATT 180 

GATGGTACGC TTTGTTTTGA CGGCCGATTA ATTGACCAGA CTATTATTGA TACATTGTTA 240 

CAATTACAAC ATGATGGTCA TGAACTTATA TTTGCATCAG CACGTCCGAT TCGTGATTTG 300 

TTGCCAGTTT T AC CATCAG T ATTTCAT CAG CACACATTAA TTGGCGCAAA TGGTGCTATG 360 

ATTTCACAGC AATCAAAGAT TTCTGTTATC AAACCAATTC ATACTGATAC ATATCATCAT 420 
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GCTGCACAAC TTGACGCTGn AGAACGCGAT TTTTGAGCGT TTAGATCCAC ATAAGCTGGC 540 

CAGTTGTATT GATGTTGCAA ATATCGACAC GCCAATCAAG AkTATTTTAT TAAATATAGA €00 

5 CCCGGCACAA ATTACAACTA TATTAGACGA GCTAGATAAA TACCATCAAG AATTGGAAAT 660 

GATTCACCAT TCAAATGAGT ATAACATTGA TATAACAGCG CAAAATATTA ACAAATATAC 720 

TGCATTACAA TATATATTTG ATGCAGATGT . TAAAT AT ATA GCATTTGGTA ATGACCACAA 780 

10 

TGATATTGTC ATGTTACAAC ATGCTAGTAG TGGCTATATT ATAGGACCAT CAGAAGCATA 840 

CACACACGCA ATATTGAAAC TTGATAAAAT CAAACACATC AATAATAATG CACAAGCTAT 900 

TTGCAAAGTC TTAAAATCAT ATAAATAAAA ACACCCCTAT CAAATGATAA TCATTATCAA 960 

IS 

TCGATAGGGG CTATTTTAAT AAAATTOGTC CTCGAACATT TCTTCCTCTT CATCTAATCC 1020 

AAATAATTCT GCCATTTCTC CATGTTCAAT TAACATGTTT AAATATGCAT CGCGGAGTTC 1080 

TTCTTCACTC ATATCATTAA TCATTTCTTT AAGACTATCA ATCCACATAT TTCTGCGTAA 1140 

20 

TTGATAGTCT TCTTCAACTT CGTTTAACAT CATTATATGT TTATTTGCTG CTTCTGGACT 1200 

AGCTGTAAAG AGTAATG CAA TCATATGTTT ACATATCACT CGTCTTCCAT CAGCATGAGG 1260 

2S ACAATTACAT ATGGATTTTC TAGGATGTTC CATAT CAAT A TAACAACGAT ATACTTTGTT 1320 

GCCACTGCCC TTTACTTCAG CCTCATGCTG CGTTTCTGAA AATGATTTTA AGTTAATGAC 13 80 

GCATTCACTT TGATAATAAT TAAAG CCTCT TTCTATAGAA CGAATACTTG CAAT AT CAAG 1440 

30 TAATCCCATT AATG aT ACT C CTTTTTATTA TTATTTTTAA ATAAAGAaAA TAAAATAGAT 1500 

AAGTGTCTAG ATTAAAATAC TTGATTTATC TATATTTTAT AACAAGTCTA GAATTATCGC 1560 

ATTCTTAAAT AACTAATATG AAAATGcTTG CACTAATTCt TTTGTATAAG GGTGTCTATC 1620 

35 AACATTAAAT AATTCCt CTA TTGCAAAATC ATCGACTATC ATGC CATC CT TAAGAACGAT 16 80 

AATTCTATTA ACTAAGCGTT GTAACACGGA TAAATCATGA GAAATAACGA TAAAATGATT 1740 

TAAGTTCGTA ATCGTTTGCG CTTTTAATAT ATTGATTACA TTTTGTTCAG CT AT AACAT C 1800 

40 

TAAATTTGAA GTTATCTCAT CACATATTAA AACGCGAGGC TGTGCTAATA ACGAACGCAT 18 60 

GACATTAAAT CTTTGTAATT GTCCGCCACT CACTTCGCTT GGTAATTTAG TCAATAATTG 1920 

CGCGTTTAAC T CAAAAGT AG ATAAATGTTG TAATAATAAT TGATCCTGAG CAGTATTATC 1980 

45 

AGTTAGACCT CTGTAATAAT ATAACGCTTC TTTTAATGAG GTCTCAATCG TCCAATCAGG 204 0 

GTTAAAGCTA GTTAAAGGGT GTTGGAAAAT CGGTAACACA GCATTGTCAC TTAAGTAAAT 2100 

CTCTCCTTTA ACAGGTTTAA ACAAGCCAAG AACCAATGAA GCGAGCGTAC TTTTACCACA 2160 

50 

GCCACTTTCG CCTAAAATAC CAACATTTTC TCCATCAGGT ATAGTAATAT TGATATCTTG 2220 

55 
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CCCTCTTTAA TTGTGTTCTA TATTTAATTA GACGTTCAGT ATACGGATGC AAATGCTCAT 2340 
ACTTGAAATG ATTAATATTA CCTCGTTCAA TGATTTGACC TTCTTTTAAA ACATAAATGT " 2400 

S ACTGACAATA TTTCAATACA TGACTTAAGT TATGTGTGAT AATAAATAAT GTTTGAC CAT 2460 

GTTCTAATAC AATATGCTGT AATAAATCCA TCACTTGATT ACCGTTCAAA GCATCCAATG 2520 

ATGCAACTGG TTCGTCTGCA ATGATTAATT TAGGCTCCAA CATGAGAACG CTTGCTATGT 25 BO 

10 ATACGCGTTC AAGTTGGCCC CCAGAAAGTT GGAAACTATA TTTATTTAAT ATATCTTTGC 2640 

TTTGTAAATT AACCCACGAC AAAGCCTTAT CAACTTTGGA CAAAGCCTCT TCTTTACTAC 2700 

CTTTATAATG CTTACGATAA ATCGCAGTTA ACTGTTTACC TAATTTAGTA TGGTCGTTAA 2760 

IS 

AACTTTCTGC ATAATTTTGA GAAATAT AG C CAATTGTATG ACCATAATAT TGACTCAATC 2B20 

TACTAACATT TTCCCCATCA AATTGGTACG AATCATACGT GCAGCTTAAA TCAAATGGTA 2880 

AATATTCAAG TAAAGCTTTA GCAATCAAAC TTTTTCCAGC GCCGCTCTCT CCAATCAAGG 2940 

20 

CATTAATCTG TTGACTAAAA ATTTTCAAAT CAATCCCTTT AATAAGAGAT TTCTCACTAG 3000 

TATTCTTTAT TGTTAAATTT TGTATATCAA TGAGACTCAT CATATTCACC CCGTTGTTTC 3060 

AGCAATCTAT CTCTTAGTGC ATCACCGGTT AAATTAAAAA TTAAAATAGT TATAGCAATG 3120 

25 

ACTGAAGCAG GTGCAATCAA CATAATTGGA TGAGACGAAA TAAAATCACG ACCTTGTTGC 3180 

AACATAGCGC CCCaCTCTGG TGTTGGCGGT TGTGCACCTA ACCCAATAAA TGATAGTGAA 324 0 

3Q CTTATATATA GAATGATTTT ACCGAAATCA ACGACCATCA AAACGATAAT AG CCGGTATA 3300 

ATTTTAGGTG TTAAATGACG TATTAATATT GTTCTTGTTG GTACATGAAA TAATTGTGCC 33 60 

ATTTTTATAT AAGG CTTATT CATTTCGCTA TTAACTATAC TTCTAGTCAA CCTTGTGTAA 34 20 

35 TTCATCCATT TTATTAATGT AATTGAGATA ACTAAATTCC ATAAAGATGG TTGAAAAAAA 34 80 

CTTCScTAAAG CAATCATGAT GATAAATTCT GGAATACTTA GACCAACATC AATAAACCTT 354 0 

AACACTAATC GTTCAATCCA CCCTTTTTTG TATCCGGCAA ATAGACCTAG TGTAACACCT 3 6 00 

40 ATGACAACGA TAG CT ATT AA TGTTAAAACA GTAACAAACA ATGTTGAACG TGCACCGATA 3660 

ATAATTCGGG TAAATAAATC TCTCCCATAA TCATCAGTTC CTAATAAATG CAACCAACTA 3720 

ATAGGTTCAA AAGTTTGTGA TAAATTGACT TTGGTTGCAT TTTCACTACT GACAAAGAAT 3780 

45 TGCAGTACAA TTACCACAAA AATAAATGCA ACGAATACAA AAAATATCAG GTTATT CTTT 384 0 

GAAAATATTT TATGCATGAC GGTCACTACT TTCTGATATC AATGGTGTAT TGGTTTTGAT 3900 

TTTTGGATTT CCTAATTGTA AACGCTGCTT CGGATCAAGT AATAACGTTA ATAAATCAGC 3960 

SO 

AATCGTATTG ATAATAACAA CGAAGAAGCC AATAAATAAC ACGCATCCTT GAATAACAGG 4020 
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ATTTTCAATC 


ACTACAGTAC 


CACCTATTAG 


ACTGCCAAGT 


GAAATCCCTA 


GTAATGGGAT 


4140 




AATCGGCAAA 


ATTGTTGGTT 


TTAGTAAATC 


ATGAATTAAA 


ATATAACGTT 


CATTCATACC 


4200 


6 


GCGTAATCTT 


GATGCTTGTA 


CGATATTACT 


TTGCAATAAC 


ATCAATAAAT 


TAGAACGCAC 


4260 




TAAACGAATG 


ATGTATGCAC 


ACATACCTAA 


AGAT AG CGTG 


ATTACAGGTA 


ATATAAACTG 


4320 




ACTTAGTATA 


ACGCTATCTA 


TATTCATTAA 


ATTTGTGACA 


ATAAATAATA 


AAATAATACC 


4380 


10 


GATAAAGAAC 


GCTGGTAAAC 


TAATCGATAG 


TGTTGAGATC 


ACTCTAATCA 


CTTTATCCGT 


4440 




CCACTTATGA 


AATCGTTTGG 


CTGCTATAAT 


GCCGAGCGGT 


ATAGATATGC 


ATAACGACAC 


4500 


15 


TACTAATGTT 


GAAAATGATA 


TGAGTAATGT 


TATGGGTGCA 


TAGTTGAATA 


ATATCTGTGT 


4560 


TACCGGTTCT 


TTTGATTCAA 


AACTTTTTCC 


TAAATTAAAA 


TGTAATAAAT 


GATTCATCCA 


4620 




ATGCCACCAC 


TGTACCAATA 


AAGAATCATT 


TAATCCCAAT 


TTATCTTTGG 


TTGCATTTAT 


46B0 


20 


TTGTTCCGTC 


GACACTTGTG 


CTACATCAAG 


ATGTAATATT 


TTATCAACAG 


GATTGCCTGG 


4740 




TGATAATTTC 


ATTAAAATGA 


ATGTAAGTGT 


AGAAATAACA 


AATAAAACAA 


CTATCATTTG 


4800 




CATCAGT CTA 


T A GAACAT AG 


ACTTTATTAT 


GAACATAATA 


GTCCCCCTCC 


TTGTGTAAGT 


4860 


25 


TACTAACACT 


TTCTTTTTAC 


ATGAGAATGG 


CG CATGT AT A 


TGCAACTTAC 


ATATTAAGAA 


4920 




CTAACGTTCA 


TTATAGTATT 


ATCCATAAAG 


AAATTGAAGT 


ATATTTAATT 


TTTTAACAAA 


4980 




ATCATTATAA 


AATATAATAT 


TTTGAATCAA 


GTCAACCATG 


TAAAATATAA 


AAAAGTCAAA 


5040 


30 


ACAAAAACAA 


CTATAGCACT 


GTATTC CATC 


TCTTTCGAAA 


TAATTGTTAC 


TGCAGTGTAA 


5100 




CTTAAAAGTC 


GATGATTTTG 


TGCATATAGT 


TGTCGAATAT 


TATITITTAT 


CTTTACGGCG 


5160 




AAGTTCAGCG 


CCCTCATAGC 


CGTATTTTTC 


AATTTGCTTT 


TCTAATTTAC 


GCGCTTTTCT 


5220 


35 


TTCTTTACGC 


CAATTTCTAG 


TAAAATACCA 


TAATAGAAAA 


CTAATTAATA 


AACTCATAAT 


5280 




CGCTAAAAAT 


GCAGCGTATC 


CTAATAATGG 


TTGATATTTT 


ATATCTTGAA 


AATTTGGAAT 


5340 




AAAAAATGCA 


AG CACAC CTA 


ATATAACAAA 


TGTAATTACT 


GCAGATACAA 


ACCATTTATT 


5400 


40 


TAAAACTAAG 


CAACAGAATA 


TTGTTAATAA 


AATCATTATT 


AATGTTGTGA 


TCCATAAATA 


5460 




ATT AGG CAT A 


TCGAATAATG 


TCATATTCAT 


TCTCCTTTTA 


TTTCATTACT 


TTCCTTGTAT 


5520 


45 


ACATTTTATT 


ATAAATTTTT 


AAAAACTTAA 


ACAATAGCAG 


TCAGTTTCAA 


GCAATATTCT 


5580 


ATCTACTAAT 


AGAAAAATCA 


TTGTTCCTTG 


CGACATGGAA 


ATCGTAACAT 


TATCGTTTAG 


5640 




GAGACAAAAT 


TATGTATAAT 


GAATGTATTA 


TACCAAAGGA 


GTGATTATAT 


GTCTCAAGGT 


5700 


50 


TTACCTTTAA 


GAGAAGATGT 


TCCTGTTTCA 


GAAACATGGG 


ATTTAGTAGA 


CTTATTTAAA 


5760 


GATGATCAAC 


AATATTATGA 


AAGTATTGAC 


GCTCTAGTAC 


AnCAAGCAAA 


TCAATTT CAT 


5820 
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GAAAATATTT TAATTGCCTT AGATOGCTTA AGTAATTATG CAGAACTACG TTTAAGTGTA 5940 
GATACTAGTA ATATCGAGGC ACAAGTATTG AGCGCTAAAT TATCTACTAC ATACGGTAAA 6000 
ATTGTTAAGC CAATTATCCT TT €022 
(2) INFORMATION FOR SEQ ID NO: 93: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 476 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 93: 

CCATCAATAA TGTATACATG ATTGGCATCA TATTCCCCTT TAATTAGAGA GCTACGTACA 60 

GTTTGTyTTA TTAAAGTAGA ACTAATAAAT AACCATCTCT TATGTGCACA AACACTTCCC 120 

GCAACAATTG ATTCAGTTTT ACCAACCCGT GGCATACCTC TAATGCCAAT CAACTTATGA 180 

CCTTCTTCTT TGAACAATTC AGCTAAAAAG TCTACTAACA AGCCTAAATC TTCACGCTCA 24 0 

AATCGAAAGG TTTTCTTATC TTTTGCATCT TGCTCAATAT ATCTTCCATG TCTTACTGCA 300 

AGACGGTCTC TTAATTCTGG TTTTTTAAGC TTTGTTATTT CAATTTCATT TATACCACGA 360 

GCTATTTGCT CAAAACGTTC AACTTTTTCA AGATTGTCTG TTTTAATTAA - AAGGCCTCGT 420 

30 TTACCTTGAT CAACACCATT AATTGTAACA ATACTTATAC CTAACATACC TAATAA 476 

(2) INFORMATION FOR SEQ ID NO: 94: 

<i> SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3 633 base pairs 
35 <B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
- <D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 94: 

AGAAATACAA CGAAGCATAT AAATATAACC GATCTTTTTT CTAATTGAAT ATTAAGTAAG 60 

TGTATGTACT TTCTGGAAGT AGCACCTAGT rGGATTGTtC CTCCTACAAC AGGCCAAAAA 120 

TTTTTATTTT TAACTGGCTT AACAGTGTTC AGTTTTTCAT ACTCTTCTCT ACTAATTTTG 180 

GCGCACCTTT TTGGAATGAA CCAATTAATA AATGGAAAAA AGTATACAAG CCAAGTTCTT 240 

ATTACATCGA CCATTAAATA CTCATCATCA TACTTAATAA CTCTGTATTT CGGATTTTTA 3 00 

TTGATAATTT CGGTTTCACA AAGCAATAAT TATCACTTCC TATTAATAAC AAATTCACAC 360 
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TTATATGACC TTAAATATAT AACATGAATC TTTTTGTCTA TTATTGAAGA CATATTTATA 4 80 

AAOAAAAATA GCATTGTCAT AATAACCCAA GCAATAAATA CTATAATATT TTGGATAGAT 540 

5 

AAACTAATCA rrACATCTAA GAACATGATT gATAATCCAC CACAGAAAAA ATAAGAAAAT 600 

AGTACAAAGC AAAGATTCTT GAATGATGGA AAAATCATAA TTTTTCCATT GCTACTCCGA 660 

TCATTATAGA TAOATAACTT TACTTTCTGA TTTAAATATA TATAAAACAC TAGAATACTT 720 

10 

AATAATAAAA CCGAACAAAT GATAATAACG CAATTTTTTT CTAAATGAGA ATCAGGTATA 780 

TATATTTTAT CTCTAAACAT AGTGCCAAAT AAAAGTATGC TACCTATAGC TGGCCATAAA 840 

15 GCTTTaTTTT TAACTGGTTT GACAATATTT AAATTATCAA AATCTTCTCT GCTGATTTGG 900 

ACATATTTTT TTGGTATTAA CCAATTAATA AACGGAAAGA ACAAAACTAA CCAGGTG CTT 960 

ACTAAATCAA TCATCAGATA GTCGTTTTTA TATTTAATAA TTCTATATCT GGGATTTTTG 1020 

on 

TTTACAACTC TAACCTCGCA AAGCAATATC TCCACTTCCG TCTCGTTGGT TTTATATCTA 1080 

ATACACTTTC AGATACTTTA TAAGTGTTTT GTATTTTAGT AACATACTAT TTTCCTGTTT 1140 

ATTACTTAAC TTACGAACTA CAATCTAAGT TTAGTAATTT CTATTGCTTT TTAAGTTTGG 1200 

25 

CATAAACCTT TTTATTACTA ATTGAG C CCA TG CTT ATT AG AAAGAAAAAA ATTGTAATAA 1260 

TAATCCACAT AATAAATACC AGTAGATTTT GAGGTTTTAT AGTCATTAGC CATATTAAAA 1320 

30 ATAATATAGA ACAACCTCCT AATAATAGAT ATGTGAAAAC TATAAAACTT CCATCTTTAA 13 80 

AAGTAGGCAC TAATATAACC CTATTTTCAT TATCTAGATT ATCATCATAT ATCTTTAGTT 1440 

TAAGCTTTTT ATTTAAGTAA ATGTAAAATG CTGCAATACC TATAAATCCT ATAAAACATA 1500 

35 AAGATATTAA AATCTTATTA TCTAATTGAA CTTCAAACGT ATGTACATAT TTCCGTAAAA 1560 

TAACTACAAA TAAAAACGAA CT AC CAGTAA CTGGCCAGAA AATATTATTT TTATTTTGTT 1620 

TATCAACATT TAAATTTTCA AGTTCCTTCT CACTAAGTTT TGCATACCTT TTGGGAATGA 1680 

40 

ACCAATTAAT AAAAGGAAAA AAGTATACAA GCCAAGTGCT T ACT AAAT CA ATTAACAAAT 174 0 

ACTCATCATT ATATTGAACG ACTTTATATC TCGGATTTTT ATTAATAACC TTAATATTAA 1800 

AAAGCAAAAC TCACCACGCC CATTT CATTG GATTTATATG ATTGCTAATA ATATTTTTAG 1860 

45 

CTTCACTAAC AG CATTCCCA ACACTATCCA TGGATTTTTC TGTAGTTTTT TTAACAACAT 1920 

CTATACTATT ATCGATTTTA TGCCCTACCC AGTCTACTTT ATCTTTTAAT CCAAAAATAT 1980 

So TATTTTGATA AATTAAATCT GTTCCTAATG CAAATACTGT ACTCATAGCC AAACCTGCTA 2040 

AAATCACCCA TCCTACTGGA TTACTTCCTA AAACAAAAGT CGCTAATCCA GCTCCAACTG 2100 

CTGTCCCTGC AGATCCAGCT GCAAGCGTgC ATACCATTAT GCGACAACGC CTCTCCAAAT 2160 

55 



574 



EP0 786 519 A2 



CCTTTACCTA GGTATTTTCC 6CCTTTTGCA AATTTACTAC CATTTTCTAT AAACACATTA 2280 

CCTGATGTAC GTTTGACTTC CACAAATGAA TTTGGACCTQ CTGGGCCTTT CACTCCACCT 2340 

5 GCTGTATTGa TAAATACACC GAATTTACTT GcATTTATAC CGTCTTGCTC TAAAAGTGTT 2400 

GACGTAATAT CTAATCCTAT ATCTCTTTTA ATACTGTCTT TATTGTCATT TATATATTTC 2460 

AATATACTTT TCGGGATATC GTCTTCTGGA TGTTCTTTGG CATATGCCTT TATAACAGCA 2520 

w 

AAGTCTGCTT TATTTAAAGT TTCTTTCTCT GCTTTATGTT CAATTTTCCC CATAGCAACT 2580 

TTCAAATATT TTTCATGACT TGCTTTGGCC CAATCAAGTT CTTTACCTGA AGGAATATTA 2640 

1S AATTGATTTG TTGAAAAGTT CCAAAAATTC TGCGCTTGGG TAAGTCCTTG TTGGACAATT 2700 

TTTTGAAATT CTTCAACTTC TTTAAATATT TCTGGTGATT TTTGATTAAA CTCACGCAAT 2760 

TTGCGTAGCT TCTCTTCTAA TTCATGTTTT TGTTGACCTA ATGTT CGTAT TATTTGTTGG 2820 

20 TTCGATGAAA TGGCTTGCTG ATTATCGGAA GCATGCTTTT TCAAATTGTT ATTCAAATTT 2880 

TCATATCGCG TAATTTGTTG ACTTAATGAT CTGATATCTT CTTCAAGCTC TGATTCTTTT 2940 

AAAGATATGC TATCAACCTC ACTCGTATAA CGTGACACAA AATTaTCGCA AGCTTGCTTC 3000 

25 

GTTAAATCAC TCAATGTTTT CATACTTGTT GATAATGGAA TTAACACCGT ACTAAAAAAT 3060 

TGCTTAGCTG ACGTATACGC TTTCCCTTTA AGCGCATCAT CATT AAT AAA TTGAGTAATT 3120 

GCTTTTTCCA ACGCATCATA ATTTGAATTC ATTGTTTGAC TCAAATTCCC CACACTTGAA 3180 

30 

GCTTGGTTTC GAGATCTGTC TAAATACATG TCAATACTCA TCGGCATGCT CCTTTTTCAA 3240 

AAATATATGA TTTTCAAACT ATTTAAAATC AAATGCTTTT TACATCTACA AAGTTGTAAA 3300 

3S ATTTTAAAAC TCGGCGATGA TTATTTCTTA TGTAAAGGAG TCTAGATGCA GGTAAATTGA 3360 

GATAACATGT CGCCTTTTTT CTTATTTTAG CATATGGATA TAATGGTGTC TTTGTATATT 3420 

CGCAATTAAT CAATAAAAAT TATCTTTCAA TATTTTAATT TTATTGCGAC AACATCCTTA 3480 

40 ACATTAAATA TATTAATATC TCAAAATATA TTCACTATTA AAATATGTCA TCAGTTGTTA 3 540 

AAAGTATTTC CTCATCATGC GAAATATCAA AACGTATCTA AAATACGAAT AAGTTTATAC 3 600 

AATCACACAA CATCATCATT CAAAATTTTA TTG 3633 

45 

(2) INFORMATION FOR SEQ ID NO: 95: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2365 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



55 
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TGATACGAAt GCATTACAAT TCATATGCAA 
AAACAAATAG TTGATGTGAC ATCTGTAGCA 
6 ATGGAAATGT CGATGAAGTG TATCAGCAAT 

AAGAGAGTGA GAATACTGAC AATATTAATA 
AAGTAACAAC ACCAATTTTA GTGAAAGCAC 

10 

AAGTAAGAGA TTCAATTTTT AGAGAGAAAA 
ATGAAGAATC CAAAGTAATC GCACCGTTCA 
AGCATGCAGT TGGTATTCAA TCAGAAGACG 

15 

ATACAGTTGA CTTGOAAGGT AAAGOGTTCA 
AAGCAGGGCA AACGTTGTTG CAATTCGAC C 

20 CTGACGTTAT TGTCGTTATT AGCAACTCTG 

ATGAAATCAT TACGACTGAA GATGTTATTT 
TAATAATGAC AAAATTACCG CAAAATTTCA 

26 TTGAAGGTGG ATATGATAAA GGTGGTAAAG 

GTGCACATGG CAAAGCACGT CAGATTACAG 
ATCATGAAGG TATTGATTTT TATCATCGTT 

30 

TGGGATTGAA ATGTTTACGT ACGTCGATTG 
AAGATGTGCC AAATGAAGAA GGACTCGCCT 
CACAAGGTAT TGAACCTGTT GTGACGTTAT 

35 

AACATTATGG TGGATTTAGA AATAGAGAAG 
TTGTATTTGA AAGATATAAA GATAAAGTTA 

40 ATCAGATGGA CACATCAAAT CCTATCTTTT 

AAAATGATAA TCCTGAAGAA GTCyTGTATC 
CyTTAGCAGT TCGTCTTGGT AAAGaGATtA 

43 CAmaTGTACC CmTTTATCCa TAwTCGTGTC 

CGAATCGCTT ACGTTTCTTT TTCCCGGATG 
CTAAAAAAAT GTTGGCACGA AAAGGATATG 

SO 

TTTTACAGCA GGGCACGGTT GATTATATTG 
AACATGATGT TGATACTACA GTTGAAAACA 

55 
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CATACAATTC CTTCTACAGC AAATGAAGTG 60 

GAAAATGATA CGCATTAGTC ATAAAATTAA 120 

TACAGCGATT AATTAAGAAT GCTAATGTCG 180 

GTCAAGATAC AAGTTATACA CCTCAAGTAA 240 

CAATCGCTGG TCGTCGTATT TTACTTAAAG 300 

TGGTAGGTGA AGGCTTAGCA ATCAAAGCTC 360 

ATGGTTTAAT ATCTATGATT GTACCAACTA 420 

GTGTGGACAT AGTCATTCAT ATTGGCGTGA 480 

AGTGCTTTGT AAAGCAAAAT GATCATGTTG 54 0 

AGCAATATAT ACAACAACAA GGCTACAATG 600 

CCGATTTAGG AAAAGTAGAA CTGACAATGA 660 

TTAAAATATT TAAAAACTAG GAGTGTGTTG 720 

TGTGGGGTGG CGCTCTTGCC GCAAATCAAT 780 

GGTTAAGTGT AATTGATGTT ATGACGAGTG 84 0 

AATCTATAGA TCCCAATCAC TATTATCCAA 900 

ATAAGGAAGA TATTGCCTTG TTTAAAGAAA 96 0 

CGTGGACACG TATC T TTCCG AATGGGGATG 102 0 

TTTATG AT CG TATCTTTGAT GAATTAATTG 108 0 

CACATTTTGA GATGCCACTT CATTTAGCGA 114 0 

TTGTCGATTA TTTTGTGCAT TTTGCGCGTG 1200 

CATATTGGAT GACGTTTAAT GAAATTAATA 1260 

TATGGACGAA TTCTGGGGTA GCATTGACAG 132 0 

AAGTAGCACA TCATGAACTT TTAGCCAGTG 13 8 0 

ATCCgAaGTT TAAGATTGGr ACmATGATTt 144 0 

ATCCGAAAGA TATGATGGAA GCACAAATTG 1500 

TCCAAGTGAG AGGTTATTAT CCAAGCTATG 1560 

ATGTTGGATG GCAAGAAGGG GACGACAGTA 1620 

GCTTTAGTTA TTACATGTCT ACGGCTGTAA 1680 

ACATCGTCAA CGGTGGTTTG AATCATTCTG 174 0 



576 



EP0 786 519 A2 



10 



GATATACATT GAATGTGTTA TATGATCGTT ATCAGTTACC ACTTTTTATT GTGGAAAATG i860 

GTTTTGGTGC AGTTGATGAA GTGGTAGATG GACATATTCa TGATGATTAT CGCATTGAAT 1920 

ATTTAAAAGC ACATATTACA GCAGCGATAG AAGCAGTTGA TCAAGATGGT GTAGATTTAA 1980 

TCGGTTATAC ACCGTGGGGA ATCATTGATA TTGTTTCATT TACAAC CGGT GAAATGAAGA 204 0 

AACGCTATGG TTTAATATAT GTTGATCGAG ATAATGATGG TCATGGCACG ATGGAACGCT 2100 

TGAAAAAAGA TTCGTTCTAT TGGTATCAAC AAGTGATAGC ATCAAATGGA GATAAATTAT 2160 

AAAGGTATAT TATAAGTATT TTAGGGTTAG AGCCCGAGAC ATAAATTAAT ATAGTAGGAC 2220 

f5 CTACAGTGTT ATAATGGCGG gCCCCCAACA CAAAGAATTT CGAAAAGAAA TTCtAcAGGT 2280 

aATGCaAGtT GGCGGGGcCC AACACAGAGA AATTCGAAAA GAAATTCTAC AGGTAATGCA 2340 

AGTTGGGGAA GGACAGAAAT AAATT 2365 
20 (2) INFORMATION FOR SEQ ID NO: 96: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH i 11050 base pairs 

(B) TYPE: nucleic acid 
25 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



30 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 96: 

CTGCGATACG ATTTGTTGAA AGTGGGGAAA ACAAAAAAGT TATCATTACC AATTTAGAGC 60 

AGGCATACGA AGCTTTGATT GGTAATAAAG GTACACACAT TCACATGTAG CACTTTATCA 120 

35 CGCGACAAAA CATTAAATAT GTTTCTCCGT TGATTCAAAT GAAAAAGTTG TCTGCTGACA 180 

CTTTGCAAGG TTTGAAGGAG TTTAACTTAT GACAGAAAAC TTTATTTTGG GTAGAAATAA 240 

TAAAXTAGAA CATGAACTAA AGGCATTAGC AGATTACATT AATATACCAT ATAGTATATT 300 

40 ACAACCATAT CAAAGTGAAT GTTTTGTCAG ACATTATACG AAAGGCCAAG TTATTTATTT 360 

TTCGCCACAA GAAAGTAGCA ATATTTACTT TTTAATTGAA GGTAACATTA TTAGAGAACA 420 

TTACAATCAA AATGGAGATG TATATCGTTA TTTTAATAAA GAGCAAGTAT TATTTCCAAT 480 

4S 

CAGTAACTTA TTTCATCCGA AAGAGGTTAA CGAATTGTGT ACAGCATTAA CCGATTGTAC 540 

AGTTCTTGGA TTGCCTAGAG AATTGATGGC CTTTTTGTGC AAAGCTAATG ATGATATATT 600 

TTTGACACTT TTTGCATTAA TAAATGATAA TGAGCAGCAA CACATGAACT ATAACATGGC 660 

so 

ATTAACAAGT AAATTTGCTA AAGATCGAAT TATCAAATTG ATATGCCATC TATGTCAGAC 720 

AGTAGGATAC GATCAAGATG AATTTTATGA AATCAAACAG TTTTTAACTA TTCAAC t CAT 780 
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35 
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'IV* h ft A K ^^^P^P 

X\xAAAAAl7X 1 


GTTGTTAAAG 


ATCATAAAAA 


TTGGTTAGTA AGCAAACATT 


TATTCAATGA 


900 


XviX AI\i XGTT 


TAATATACAA 


4 ill if ii m m m m m 

TGTAAAATGA 


ATAAGTTGAA 


CATGAGGTCT 


AACGTACATT 


960 


TATACullAO 


GCCTTTTTTG 


CTAGCATGAT 


GAATAATTTA 


AAATGTTAGT 


TAAATTTGAT 


1020 


TGTTGAAATT 


ACAQTAAAAT 


TTAAGGTGAT 


GAAAAATTTA 


GAACTTCTAA 


GTTTTTGAAA 


1080 


AGTAAAAAAT 


TTGTAATAGT 


GTAAAAATAG 


TATATTGATT 


TTTQ CT AG TT 

X X 4 V X ow A A 


AACAGAaAAT 


1140 


TTTAAGTTAT 


ATAAATAGGA 


AGAAAACAAA 


TTTT A CRT A A 


X 4 X X X X J. V>\3A 


AAAGCAATTG 


1200 


ATATAATTCT 


TATTTCATTA 


TACAATTTAG 


A fT A A T f^T A f2 


A& ATTOAA AT 


GGAGTAATAT 


1260 


TTTTGAAAAA AAOAATTGAT 


TATTTGTCGA 


AT A&flf^fl A A 




ATTAGACGTT 


1320 


TTACAQTAGG 


TACCACATCA 


GTAATAGTAG 






ATAGGCAATC 


1380 


ATCAAGCACA 


AGCTTCAGAA 


CAATCGAACG 


ATA<JAACGCA 


AT LT1 CG AAA 


AATAATGCAA 


1440 


GTGCAGATTC 


CGAAAAAAAC 


AATATGATAG 


AAAGACCTCA 


ATTAAATAGA 


ACGGCTAATG 


1500 


ATACATCTGA 


TATTAGTGCA 


AACACAAACA 


GTGCGAATGT 


AGAT AG CACA 


ACAAAACCAA 


1560 


TGTCTACACA 


AACGAGCAAT 


ACCACTACAA 


CAGAGC CAG C 


TTCAACAAAT 


GAAACACGTC 


1620 


AACCGACGGC 


AATTAAAAAT 


CAAGCAACTG 


CTGCAAAAAT 


GCAAGATCAA 


ACTGTTCCTC 


1680 


AAGAAGCAAA 


TTCTCAAGTA 


GATAATAAAA 


CAACGAATGA 


TGCTAATAGC 


ATAGCAACAA 


1740 


ACAGTGAGCT 


TAAAAATTCT 


CAAACATTAG 


ATTTACCACA 


ATCATCACCA 


CAAACGATTT 


1800 


CCAATGCGCA 


AGGAACTAGT 


AAACCAAGTG 


ITAGAACGAG 


AGCTGTACGT 


AGTTTAGCTG 


1860 


TTGCTGAACC 


GGTAGTAAAT 


GCTGCTGATG 


C 1 AAAGGTAC 


AAATGTAAAT 


GATAAAGTTA 


1920 


CGGCAAGTAA 


TTTCAAGTTA 


GAAAAGACTA 


\LJ\.L X lVoM^.^.^. 


1 AA 1 (_AAAtr X 


GGTAACACAT 


1980 


TTATGGCGGC 


AAATTTTACA 


GTGACAGATA 


A Af2Tf2 A A ATT* 




TTTACAGCGA 


2040 


aGTTACCAGA 


TAGTTTAACT 


GGTAATGGAG 


ACGTfiGATTA 


xxv.. xnnx x v^/^ 


AATAATACGA 


2100 


TGCCAATTGC 


AGACATTAAA 


AGTACGAATG 


GCGATGTTGT 


AGCTAAAC5CA 


ACATATGATA 


2160 


TCTTGACTAA 


GACGTATACA 


TTTGTCTTTA 


CAGATTATGT 


AAATAATAAA 


GAAAATATTA 


2220 


ACGGACAATT 


TTCATTACCT 


TTATTTACAG 


ACCGAGCAAA 


GGCACCTAAA 


TCAGGAACAT 


2280 


ATGATGCGAA 


TATTAATATT 


GCGGATGAAA 


TGTTTAATAA 


TAAAATTACT 


TATAACTATA 


2340 


GTTCGC CAAT 


TGCAGGAATT 


GATAAACCAA 


ATGGCGCGAA 


CATTTCTTCT 


CAAATTATTG 


2400 


GTGTAGATAC 


AGCTTCAGGT 


CAAAACACAT 


ACAAGCAAAC 


AGTATTTGTT 


AACCCTAAGC 


2460 


AACGAGTTTT 


AGGTAATACG 


TGGGTGTATA 


TTAAAGGCTA 


CCAAGATAAA 


ATCGAAGAAA 


2520 


GTAGCGGTAA 


AGTAAGTGCT 


ACAGATACAA 


AACTGAGAAT 


TTTTGAAGTG 


AATGATACAT 


2580 
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ACCAATTTAA AAATAGAATC TATTATGAGC ATCCAAATGT AGCTAGTATT AAATTTGGTG 2700 

ATATTACTAA AACATATGTA GTATTAGTAG AAGGGCATTA CGACAATACA GGTAAGAACT 2760 

TAAAAACTCA GGTTATTCAA GAAAATGTTG ATCCTGTAAC AAATAGAGAC TACAGTATTT 2820 

TCGGTTGGAA TAATGAOAAT GTTGTACGTT ATGGTGGTGG AAGTGCTGAT GGTGATTCAG 2880 

CAGTAAATCC GAAAGACCCA ACTCCAGGGC CGCCGGTTGA CCCAGAACCA AGTCCAGACC 2940 

CAGAACCAGA ACCAACGCCA GATCCAGAAC CAAGTCCAGA CCCAGAACCG GAACCAAGCC 3000 

CAGACCCGGA TCCGGATTCG GATTCAGACA GTGACTCAGG CTCAGACAGC GACTCAGGTT 3060 

CAGATAGCGA CTCAGAATCA GATAGCGATT CGGATTCAGA CAGTGATTCA GATTCAGACA 3120 

GCGACTCAGA ATCAGATAGC GACTCAGAAT CAGATAGTGA GTCAGATTCA GACAGTGACT 3180 

CGGACTCAGA CAGTGATTCA GACTCAGATA GCGATTCAGA CTCAGATAGC GATTCAGACT 3240 

CAGACAGCGA TTCAGATTCA GACAGCGACT CAGATTCAGA CAGCGACTCA GACTCAGATA 3300 

GCGACTCAGA CTCAGACAGC GACTCAGATT CAGATAGCGA TTCAGACTCA GACAGCGACT 3360 

CAGACTCAGA CAGCGACTCA GACTCAGATA GCGACTCAGA TTCAGATAGC GATTCAGACT 3420 

CAGACAGCGA CTCAGATTCA GATAGCGATT CGGACTCAGA CAGCGATTCA GATTCAGACA 34 80 

GCGACTCAGA CTCGGATAGC GATTCAGATT CAGATAGCGA TTCGGATTCA GACAGTGATT 3540 

CAGATTCAGA CAGCGACTCA GACTCGGATA GCGACTCAGA CTCAGACAGC GATTCAGACT 3 600 

CAGATAGCGA CTCAGACTCG GATAGCGACT CGGATTCAGA TAGCGACTCA GACTCAGATA 3660 

GTGACTCCGA TTCAAGAGTT ACACCACCAA ATAATGAACA GAAAGCACCA TCAAATCCTA 3720 

AAGGTGAAGT AAACCATTCT AATAAGGTAT CAAAACAACA CAAAACTGAT GCTTTACCAG 3780 

AAACAGGAGA TAAGAGCGAA AACACAAATG CAACTTTATT TGGTGCAATG ATGGCATTAT 3840 

TAGGATCATT ACTATTGTTT AGAAAACGCA AGCAAGATCA TAAAGAAAAA GCGTAAATAC 3900 

TTTTTTAGGC CGAATACATT TGTATTCGGT TTTTTTGTTG AAAATGATTT TAAAGTGAAT 3960 

TGATTAAGCG TAAAATGTTG ATAAAGTAGA ATTAGAAAGG GGTCATGACG TATGGCTTAT 4020 

ATTTCATTAA ACTATCATTC ACCAACAATT GGTATGCATC AAAATTTGAC AGTCATTTTA 4080 

CCGGAAGATC AAAGCTTCTT TAATAGCGAT ACAACTGTTA AACCATTAAA AACTTTAATG 4140 

TTGTTACATG GATTATCAAG TGATGAAACG ACATATATGA GATATACAAG CATAGAAAGG 4200 

TATGCGAATG AACACAAATT AGCTGTGATT ATGCCCAATG TGGATCATAG CGCATATGCT 4260 

AACATGGCAT ATGGTCATAG CTATTATGAT TATATTTTGG AAGTGTATGA TTATGTTCAT 4320 

CAAATATTTC CACTTTCCAA AAAGCGTGAT GACAATTTTA TAGCAGGTCA CTCTATGGGA 4380 
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TTATCTGCTG TGTTTGAAGC GCAAAATTTA ATGGATCTAG AGTGGAATGA TTTTTCAAAA 4500 

GAGGCCATAA TTGGCAATCT TTCAAGTGTT AAAGGAACTG AACATGATCC GTATTACTTG 4 560 

CTAGACAAAG CTGTAGCTGA AGATAAACAA ATTCCAAAAT TGCTCATTAT GTGTGGTAAA 4620 

CAAGACTTTT TATATCAAGA CAACTTAGAT TTTATCGATT ATTTATCACG CATAAATGTT 4680 

CCTTATCAAT TTGAAGATGG ACCAGGAGAT CATGATTATG CATATTGGGA TCAAGCGATT 4740 

AAGCGTGCTA TAACATGGAT GGTGAATGAT TAATTATTTC TTGGAAAATA TGTGGCTGCA 4 800 

TTAAATACAC AGAGTGAGAG ATACAAACTA TTTACGCACG ACTAACATTT CTAAGTGTTT 4860 

AAATTATTTT TGTATTAATA TGATTGGCGC AATTTGCTGA TACACAAAAA TGTTTCTCGT 4 920 

GAAACTTAGA TTTAGCTTAT AGTTTTATCA TCATTTGTAT GACTTACATT ATAAATTTTA 4980 

TTATAATGAG GTTAACGCTT TGAAAGGAGT CATCATCATG TCGACCAATA AAAACGATTA 5040 

20 TGAGCATATG TTGTTTTATT TTGCATATAA AACCTTTATT ACTACCGCTG ATGAAATTAT 5100 

AGAGAAGTAT GGTATGAGTC GTCAGCATCA TCGTTTTTTG TTTTTTATCA ATAAATTACC 5160 

TGGTATTACT ATTAAATCAT TACTAGAAAT ATTAGAAATT TCTAAmCAAG GATCACATGC S220 

25 AACACTTCAA AAATTAAAAG AGCAAGGTCT CATTATTGAA AAAGTTTTAG AGACTGATCG 5280 

ACGTGTCAAA AAATTATATT CGACGGATAA AGGCGATCAA CTCATTGCTG AATTGAACAA 534 0 

GGCGCAAGAT GAATTATTGC AAAATATATA TCAACAAGTC GGTTCGGATT GGTATGATGT 54 00 

GATGGAAGCA TTGGCTAAAG GgCGACCTGG CTTTGATTTT ATTAAGCATT TGAAAGATGA 5460 

AAAAGAAAGC TAGCATCAGA AATGTTAAAA ATCTTCGCAT TCTTAAATTT AAAAAATATG 5520 

TCAAAAAGTG TATAATAAAA ACATATAATT TAATTGAACT CAGTTTCAAC ACATCTTAGA 5580 

AAGGAGTTTG AATGATGAAA AAATTAGCAG TTATTTTAAC ATTAGTTGGC GGTTTATACT 564 0 

TCG CATTTAA AAAATACCAA GAACGTGTTA ACCAAGCACC TAACATTGAG TACTAAATTA 5700 

AACCATAAAA AATTCCCGAA CACCTTGTTA TAGTGCTCGG GAATTTTTTT ATGCTTTACT 5760 

TGAATATATC AAATATTATT TTTGCGCTTT CTGTATTTTC GATATTACCA CTAAATGATT 5820 

CTGATCTAGG TCCGTAAGCG TAgGTATTAA CATCCTCGCC TGTATGTCCA TCGGAAGTCC 5880 

ACCCTGTATA AGATTTATCA TTTACTGGCT TCTGAATAGC GTGTTGTAGG GCTTTTGTTT 594 0 

GCGTTTCTAC TTCTGCGGAT TTTTCGTCTT TTTCTTTTTT AAGTAGTCTT TTTAGCTTTT 6000 

TATTCTCTTT TTTAACGTTT TTCATATCAT CTTGTGAAAA TTCAAATCCA TAACCTTCAT 6060 

TAATAACTTT TTCAGGGTCT TCACCTTTAG CCATTTTTTC TGTCATATAT GATCCAGAGT 6120 

GTTTCATAGA TTTAATCGGT TGAGGATTCC ATTCGTATCC TTTATCTTTA CCAATTGTTA 6180 
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ATTGAATGGC 
TATCGTTGGA 
TTTTATTGCG 
CTTTAGAAGC 
CTTTATCAGA 
ATTTTTTATC 
CATCAACTTT 
TATCATCTCT 
CTGTTGAAAC 
CTTTCTGCTT 
AGGCTGTTCC 
GATTTGTGCC 
CATTTTTATA 
AGATAACATT 
TATCGGATTG 
TAGCAACTGC 
TGACTATGTC 
ATGTAAACAG 
AGCGTTAGAA 
ATACTAGTAA 
GAGCGTAAAC 
AATACAAATG 
AAAGATAACA 
TGAAGATGAT 
TGTTATTGTC 
GCTTGTATTG 
CCGAAAAACA 
AATTATGGCA 
AACGATTGCC 



GTCATCGAAT 
ATGCG CTGAT 
CTCAAGCTTA 
ATCTATTGCA 
TTTTGATAAC 
TAAATTGCCA 
ATGCTTTCCG 
AGAAGTCACG 
AAGACCAGTC 
GTTACTGTCA 
GCCAGCTGCA 
TTTTAAATAT 
ATAACGATAA 
TTTTGGATTT 
CGCAATTGCA 
AAATTTTGTG 
TTCAGTGTAA 
AGTGATTTAG 
TAGAAGCGTG 
TGTTATCTCC 
GTACGAAGAA 
ACACGGAAAG 
AAGGATAATT 
TTTGTTATAG 
GTTGAACAAT 
CTAGATATTA 
TCTAATGTGC 
ATACAAATGG 
AAAATTCAAG 



GCTTTTTCAA 
TTATCTATAG 
CTAAGTGCAC 
AGTGGCATAT 
TCCTTACTGT 
TTACTTTTAC 
TTGATTTTAT 
TGTGCAGCAT 
GACTTACCTT 
ACACCGATGG 
GAATCAGTAA 
GAATCAAAAG 
GCTGTGTTAA 
TTAGTATTAC 
GGTGTGACAG 
GCTTTTTTAA 
AAGAGGAATT 
AATAACAAAA 
TGAAAATATA 
ATTATTAATC 
AAAGCAACTC 
TTCAAATCAA 
CAATTGAAGG 
CAGAGAGTTT 
TTGATGATAT 
ATTTGCCAAC 
CAATTATATT 
GGGGAGATGA 
CATTATTGAG 



AACCTTCCAT TTCAGACATA ACGCCTGTAA €300 

AAGCACCTTC GACCATTAAA AAGAATCCTT 6360 

TTTGTTGCAT ATCAGCTAAT GATGGTTOGT 6420 

TTTTATCTGC AAACAAACCA AGAACTTTAT 6480 

TCGTGGCAAG GTCGTAACCA TCTTTTTTGA 654 0 

CGAAATATTT AGCGCCGCCG CCTAATAAAA 6600 

CTTTATAAAA TTGTTTAGCG ATTTCGTTTT 6660 

ATGCTGCTGG TGTTGCATCT GTTAATTCAG 6720 

TTTCTTTTGC ACGTTCAAGC ACCGTCTTTA 6780 

CACCATTATA TGTCTTATGA CCAGAACTAA 6840 

TATTCTGTTT TGGGTCATTT GAATATGTAC 6900 

CAGTAGGGGT CATTTCTTTA GCATGCGGAT 6960 

ATGATGGACC CATGCCATCG CCAACTAAAA 7020 

CAACCGCGAA ACTTTCATCT TTAGAACTTT 7080 

AACTAAAAAC CGTTGACACG ATAATAAGGT 7X40 

CTGATAACAT AAGACATCCT CCTGAGTATA 7200 

TtGAGCAATT ATGTAGTTTT AGTTAnAAAT 7260 

aATGAATATA TATGACAATT TGTTATAGAA 7320 

GAATTAAATA TAATTTGAGG TGGAAAAATG 7380 

ATATTCTTTA TAGTGTTGTC TATTTTAGAA 7440 

GAGAAAGAAA AAGCAAATAC ACTAAATCAA 7500 

GAGCCGTCAT TGCAGCAGGA TAAAGAACAA 7560 

AAGAAGATTA TAGATGAAAA TATTAATTGT 7620 

AGCATCTGAA CTTAAAAAAT GGAATTACGG 76 80 

ACTGTCTATC TTTAACCAAA ATCAACCTCA 7740 

GTTAAATGGT TTTCATTGGT GTCAAGAAAT 7800 

TATTAGTTCC CGTATTGATA ATATGGACCA 7860 

TTTTATCGAA AAGCCATTTA ACTTGTCATT 7920 

ACGAACTTAT GACTTGTCAG TAGCTAATGA 7980 
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ACAAAACATA 


CAGCTATCTT 


TGACTGAATT 


ACAAATATTA 


AAGTTATTAT 


TTCAAAATGA 


8100 


AGaTAAATAT 


GTAAGTAGrA 


CTGCTTTAAT 


TGaAAAATGT 


TGGGaATCAG 


AAAACtTCAT 


8160 


AGATGATAAC 


ACATT AG CTG 


TTAACATGAC 


GCGCCTGCTG 


AAAAAATTAA 


ATACTATTGG 


8220 


CGTTAATGAT 


TTTATCATTA 


CAAAGAAAAA 


TGTCGGATAT 


AAAGTATAGG 


GTGAATGCAA 


8260 


TGACCTTTCT 


TAAAAGTATT 


ACTCAGGAAA 


TAGCAATAGT 


CAT AG TT ATT 


TTTGCTTTGT 


8340 


TTGGCTTAAT 


GTTTTACCTG 


TATCATTTGC 


CATTAGAAGC 


ATATTTACTA 


GCACTTGGCG 


8400 


TTATTTTATT 


ATTATTACTC 


ATATTCATAG 


GTATTAAATA 


TTTAAGTTTT 


GTAAAAACTA 


8460 


TAAGCCAACA 


ACAACAAATT 


GAAAACTTAG 


AAAATGCGTT 


GTATCAGCTT 


AAAAATGAAC 


8520 


AAATTGAATA 


TAAAAATGAT 


GTAGAGAGCT 


ACTTTTTAAC 


ATGGGTACAT 


CAAATGAAAA 


8580 


CACCCATTAC 


TGCAGCACAA 


CTGTTACTTG 


AAAGAGATGA 


GCCTAATGTT 


GTTAATCGTG 


8640 


TTCGTCAAGA 


GGTTATTCAA 


ATTGaTAACT 


ATACAAGTTT 


AGCACTTAGT 


TATTTAAAGT 


8700 


TATTAAATGA 


AACTTCTGaT 


ATTTCTGTCA 


CTAAAATTTC 


GATTAATAAT 


ATCATTCGCC 


8760 


CAATTATTAT 


GAAATATTCA 


ATACAGTTTA 


TTGATCAAAA 


AACAAAAATC 


CATTATGAAC 


8820 


CTTGTCATCA 


CGAAGTATTA 


ACTGACGTTA 


GATGGACCTC 


TTTAATGATA 


GAACAATTAA 


8880 


TAAATAATGC 


ACTTAAGTAT 


GCGAGAGGTA 


AAGATATATG 


GATTGAATTT 


GATGAGCAAT 


8940 


CCAATCAATT 


ACACGTAAAA 


GATAATGGTA 


TCGGTATTAG 


TGAAGCGrAC 


TTGCCTAAAA 


9000 


TATTTGATAA 


GGGCTATTCA 


GGTTATAATG 


GCCAGCGCCA 


AAGTAACTCA 


AGTGGGaTTG 


9060 


GTTTATTTAT 


CGTAAAACAA 


ATTTCAACAC 


ACACAAACCA 


TCCTGTTTCA 


GTCGTATCTA 


9120 


AACAAAATGA 


GGGTACAACA 


TTTACGATTC 


AATTTCCAGA 


TGAATAAAAA 


CTTTCAATAT 


9180 


TGTAAGTATA 


CTAGTAAGAT 


TTTTTTACTA 


ATTTAAATGT 


TATTAGTATT 


TTTTTGTTTT 


9240 


AATATAGAAC TAACAAAGAA ATGAGGTGCA TGCCATGTTG CTAGAAGTGn AACATGTAAA 


9300 


AAAGGTTTAT 


GGTAAAGGTT 


TGAATGCTAC 


GACAGCACTT 


AATCAAATGA 


ATTTATCAGT 


9360 


TGGAGCTGGT 


GaATTTGTTG 


CaATTATGGG 


TGAGTCTGGG 


tCAGGGAAGT 


CTACACTACT 


9420 


AAATTTAATT 


GCtTCTTTTG 


ATGGACTAAC 


TGAAGGTGAC 


ATTATTGTGG 


ATGGCGGACA 


9480 


TTTAAATAAT 


ATGAAAAATA 


AAAGTAAAGC 


ATTGTATCGT 


CaACAAATGG 


TAGGTTTTGT 


9540 


TTTTcAAGAT 


TTTAATCTTT 


TACCAACAAT 


GACGAATAAA 


GAAAATATAA 


TGATGCCATT 


9600 


AATTTTAGCT 


GGTGCTAAAC 


GAAAAGATAT 


AGAACAAAGG 


GTACATCAGT 


TGGCAGTACA 


9660 


ATTACATTTA 


GAGGGATTCT 


TAAACAAGTA 


TCCTTCTGAA 


ATCTCTGGGG 


GTCAGAAGCA 


9720 


ACGCATTGCC 


ATTGCACGTG 


CATTAGTTAC 


TAAGCCGACG 


ATTTTACTAG 


CCGATGAACC 


9780 
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TCAATTGGAA CAGACAATTT TAATGGTAAC TCATTCAAAT ATCGATGCGT CTTATGCAGA 9900 

GCGAGTCATT TTTATTAAAG ATGGGCGTCT ATATCATGAA ATATATOGTG GTGAAGAAAG 9960 

TCAATTAGCT TTTCAACAAC GAATAACAGA TAGCTTAGCA CTTGTGAATG GAGGAAGTGT 10020 

CAATATATGA AGTTAAGATT GTTATGnACA TAGTGCGACG TCAATTTATT ACGCAGCGAC 10080 

TTGTAATCAT TCCATTCATT TTAGCGGTAA GTGTACTATT CATGATTGAA TATACGCTTG 10140 

TGTCAATTGG GTTAAATAGC TACATAAAAC AGAAGAATGA CTTCCTAGTA CCATTTATTA 10200 

TCATAGCTAA TTTTTTTATG GCGCTTTTAA CTTTTATTTT TATTTTCTAT GCAAATCACT 10260 

TTATGATGTC ACAAAGACGA AAAGAGTTTA GCATTTTTAT GACATTGGGC ATGACCAAGA 10320 

AAAGTATGCG TTTAATTGTA GTGATGGAAA CTATCTTACA ATTTGTGATA ATTTCAGTCG 10380 

TTAGTATTGC CGGCGGATAC TTACTTGGTG CGATATTTTT CTTGTTTATA CAGAAAATAA 10440 

TGGGCAGTGA AGTTGCGACG TTAAGGTATT AT CCATTTGA CTCTGTAGCG ATGTTTATTA 10500 

CTTTGATTAT CATTGCTGTA TTAATGGGCA TGCTACTTAT ATTCAACTTG TTTAGTATTA 10560 

ATTTTCAACG GCCGATAACT TATCAACATC GTTCCGATTC TAGTGTCATA TCACGATGGT 10620 

TGCGTTACGT TTTAATTGTT ATAGGAAGCG CAnACTATAT TTAGGTTACT TTATTGCATT 10680 

ACAACAAGAT ACGAOGTTTG GTGCCTTTTT TAAAATATGG ATTGTCATAG GATTAGTTAT 10740 

TATCGGTACT TATGCATTTT TTGTAGGTAT AAGTGAAATA ATTATTAGTA TATTGCAGCA 10800 

GGTATCAAAA GTTTACTATC ATCCACGGTA TTTTTTTGTG GTAGTTGGGA TGCGTGTACG 10860 

TCTTAAAATG AATGCAGTCA GTCTTGCAAC AATCACTTTG CTGTGTACAT TTTTGATTGT 10920 

AACGCTCACA ATGACATTAA CAACCTATCG TGATATGAAT CATACCATTA CGAAATTGAT 10 980 

TACGAATGAT TakGATTTGT CATTTAG CGA CAATTCTAAG TCACAAaTAG AACGTCAACA 11040 

AACAATTGAG 11050 
(2) INFORMATION FOR SEQ ID NO: 97: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 983 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



50 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 97: 
CGACATAACG AGGCAAGGGT ACATGATACT TTAGCCTCGT TTTTGATATG TATTTTTCTG 60 
AATATAAGGG CAATAGATGG TATTTTATAw TTTTTTTAAG GTAGTGATTA ACATAGATAT 120 
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TCAAGCOGAA CAGCATTATG CACCAGTATT AACGCATTTT TTAGATCCAA GAGGGCAATA 24 0 

TATATTGGAA GTGATTTGTG GCAGTTATGA AGATTTAAAC GTATCTTTTT ATGGTGGACC 300 

TAATGCTGAA AGAAAAAGAG CAATCATTTC GCCGAACTAT TATGAACCTA AAGAAAGCGA 360 

CTTTGAATTA ACTTTAATGG AAATAGATTA TCCTGAAAAA TTCGTCACTT TAAAACATCA 420 

ACATATTTTA GGGACATTAA TGTCTTTAGG TATCGAACGC GAACAAGTTG GAGATATAAT 480 

TGTGaATGAA CGAATTCAAT TTGTTTTGAC AAGTAGATTG GAATCATTTA TTATGTTAGA 540 

ATTACAACGT ATTAAAGGCG CATCAGTTAA ACTTTATACT ATTCCAGTAA CAGATATGAT 600 

ACAATCTAAT GAGAATTGGA AAAATGAAAG TGCaCAGTTA GTTCTTTAAG GTTAGATGTT 660 

GTTATTAAAG AAATGATACG TAAATCACGT ACGATTGCGA AACAACTAAT CGAAAAAAAA 720 

CGTGTTAAAG TGAATCACAC TATTGTTGAT TCAGCAGATT TTCAATTACA AGCAAATGAT 780 

20 TTAATATCCA TCCAAGGTTT TGGTAGAGCA CACATTACTG ACTTAGGTGG TAAAACTAAA 84 0 

AAAGATAAAA CGCACATTAC CTATAGAACA TTATTCAAAT AGTAATGATT TAAGGAGGAT 900 

AACAAATGCC TTTTACACCA AATGAaATTA AGAATAAAGA GTTTTCACGT GTaAAGAATG 960 

25 GTTTTAGAAC CTACTGnAGT TGG 933 
<2) INFORMATION FOR SEQ ID NO: 98: 
(i) SEQUENCE CHARACTERISTICS: 

30 <A) LENGTH: 10322 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

35 

ixi) SEQUENCE DESCRIPTION: SEQ ID NO: 98: 

TTTTGCAAAG CTTATTTTAT GTCAAACAGA TAGTCAATGT GAAACAAAGG TTAGTACATA 6 0 

40 TAATCATCCA GACTTTATGT ATATATCAAC AACTGAGAAT G CAATT AAG A AAGAACAAGT 12 0 

TGAACAACTT GTGCGTCATA TGAATCAACT TCCTATAGAA AGCACAAATA AAGTGTACAT 18 0 

CATTGAAGAC TTTGAAAAGT TAACTGTTCA AGGGGAAAAC AGTATCTTGA AATTTCTTGA 240 

AGAACCACCG GACAATACGA TTGCTATTTT ATTGTCTACA AAACCTGAGC AAATTTTAGA 300 

CACAATCCAT TCAAGGTGTC AGCATGTATA TTTCAAGCCT ATTGATAAAG AAAAGTTTAT 360 

AAATAGATTA GTTGAACAAA ACATGTCTAA GCCAGTAGCT GAAATGATTA GTACTTATAC 420 

TACGCAAATA GATAATGCAA TGGCTTTAAA TGAAGAATTT GATTTATTAG CATTAAGGAA 4 80 

AT CAGTTAT A CGTTGGTGTG AATTGTTGCT TACTAATAAG CCAATGGCAC TTATAGGTAT 54 0 
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GAATGGTTTC TTCGAAGATA TCATACATAC 
TAGTGATTTA AAAAATGATA TTGATCAATA 
5 TTTGATGTTT GATCAACTGA CGGAAGCACA 

GCTTGTATTT GAACAAATCG TAATTAAGGG 
TCAQTTTCAA AAAGCGGGAA AATTAGAATA 

10 

AGAAGACTGG GTAGTTGTCG AATCTAAAAG 
ATTAATGGAT ATTGCTGAAG AGGATGTTGT 

75 TGATGACAAA GATATTGATA AATTTAATTG 
ACTATGTAAA GACATTGTAA GAGAACAAGG 
TACATTAGAT AAATCGAAAG TTATTTTTAA 

20 AAAATTAGTA AAAATATTAG CGCAACATTT 
TGTAAGGGAT GAAGCCAAAT TGCTTGGCGG 
TTCTACATTT TTAGGGGATT TTGAACCAGT 

25 

ATCATTAAAT CCAACTAAAA TTTCTGGTGC 
TGAAAATGAC TATTATGAGG AAGTACGTGC 
AACGCCTGAT GGTAACGGGA AAGTAGTTGC 

30 

GAAGCTTGAG GGACATGAAC AG CCACTTG A 
TTAAGGAGGC ATTATTACAT TTGGATCGCA 

35 AAATGAATGT CAATCAACTT TCAAAGGAAA 
TAGTAGAAGA AAATGTAGCG CTTCAACTTG 
ATGATGAACC AACTACTATT GATACTGCGA 

40 CATTACCAAG TAAAGATAAT TTGGCTATAT 
GCGAATTATT TGGAAAACAT CGACATGGTG 

GTGATTAATC AAGCACACTC AAATAGTGTT 

45 

TCTGAGACAA TGCATGTTTC AGGCTTTAAT 

GATGGCGGTA CTAAATGTTA TTATTAAGTG 

GCTGTTAAAA GTCAAAAATA CATCGAATGT 

SO 

AATTACTCAA TAGAAAAAGG TTGTCTTCAT 
GATTTGATCA ACTAATCAAA GAAGATTTTA 

65 



AAAGGTAAAT GTAGAGGATA AACAAATATA 6 60 

TGCGCAAAAG TTGTCGTTTA ATCAATTAAT 720 

TAAGAAATTG AmTCAAAATG TAAATCCAAC 780 

TGTGAGTTAG ATOCCAAATG TAATAGGTGT 840 

TTATACACCT AATGATATAC AAGTAGATAT 900 

AGGCATAGAG ATAGGTATTG TTAAAAATCC 960 

GTTACCTCTT AAAAATATTA TTCGCATTGC 1020 

TAATGAACGA GATGCTGAAA ATGCATTAAT 1080 

TTTGGACATG CGTTTAGTCA ATTGCGAATA 1140 

TTTTACGGCG GATGATCGTA TTGATTTTAG 1200 

AAAAACACGT ATCGAGTTGA GACAAATTGG 1260 

TATCGGACCT TGTGGTAGGT CGTTATGTTG 1320 

ATCGATTAAG ATGGCTAAGG ATCAAAATTT 1380 

ATGTGGTCGT TTGATGTGTT GTTTAAAATA 1440 

ACAATTACCT GATATTGGTG AAGCAATTGA 1500 

TTTAAATATA TTAGACATTT CTATGCAGGT 1560 

ATATAAATTA GAAGAAATAG AAACTATGCA 1620 

ATGAAATATT TGAAAAAATA ATGCGTTTAG 1680 

CTTCAGAATT AAAGGCACTT GCAGTTGAAT 1740 

AAAATGATAA TTTGAAAAAG GTGTTGGGCA 1800 

ATTCAAAACC AGCAAAAGCT GTGAAAAAGC 1860 

TGTATGGAGA AGGATTTCAT ATTTGTAAAG 1920 

AAGATTGTCT GTTCTGTTTA GAAGTTTTAA 1980 

ATAATTATAA ATGAATATGG TTTGGATAAG 2040 

TGTGTATAAA GTTTTGGTGA TTGCATAAGA 2100 

TGCACGCAgT ATCaTTAGTT ATAAAATGTA 2160 

AGTTAGGCAT ATAATATAAA AAGAGTTTTC 2220 

AGGAGTTAAA AATGTTAAAA GAGAATGAAC 2280 

GTATTATTCA AAATGATGAT GTTTTTTCAT 234 0 
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10 



TGGACTTATG TTCAGGCAAT GGGGTGATAC CCTTGTTATT GTTTGCGAAA CATCCACGAC 2460 

ATATAGAAGG TGTTGAGATT CAAAAAACAC TTGTCGATAT GGCGCGACGC ACATTTCAAT 2520 

TCAATGATGT TGATGAATAT TTAACAATGC ATCACATGGA TTTGAAAAAC GTTACTAAAG 2580 

TATTTAAACC TTCACAATAT ACTTTAGTAA CGTGTAATCC GCCTTATTTT AAAGAGAATC 2640 

AGCAACACCA ACATCAAAAA GAAGCACATA AGATAGCGAG ACATGAGATT ATGTGTACAC 2700 

TTGAAGATTG CATGATTGCA GCCCGTCATT TATTAAAAGA AGGTGGCAGG CTAAACATGG 2760 

TACATCGTGC AGAGAGACTA ATGGATGTCT TGTTTGAAAT GAGAAAAGTG AATATTGAAC 2820 

1S CTAAGAAAGT CGTTTTTATA TATAGTAAAG TAGGGAAATC AGCACAAACG ATAGTAGTAG 2880 

AAGGTCGAAA AGGTGGAAAT CAAGGTTTAG AAATCATGCC CCCATTTTAT ATTTATAATG 2940 

AAGATGGTAA TTATAGCGAA GAAATGAAGG AAGTATATTA TGGATAGTCA TTTTGTATAT 3000 

20 ATTGTAAAAT GTAGTGATGG AAGTTTATAT ACAGGATACG CTAAAGACGT TAATGCACGT 3060 

GTTGAAAAAC ATAACCGAGG TCAAGGAGCC AAATATACGA AAGTAAGACG TCCGGTGCAT 3120 

TTAGTTTATC AAGAAATGTA TGAGACAAAG TCTGAAG CAT TGAAGCGTGA ATATGAAATT 3180 

25 

AAAACTTATA CCAGACAAAA GAAATTGCGA TTAATTAAGG AGCGATAGTA TGGCTGTATT 324 0 

ATATTTAGTG GGCACACCAA TTGGTAATTT AGCAGATATT ACTTATAGAG CAGTTGATGT 33 00 

ATTGAAACGT GTTGATATGA TTGCTTGTGA AGACACTAGA GTAACTAGTA AACTGTGTAA 3360 

30 

TCATTATGAT ATTCCAACTC CATTAAAGTC ATATCACGAA CATAACAAGG ATAAGCAGAC 3420 

TGCTTTTATC ATTGAACAGT TAGAATTAGG TCTTGACGTT GCGCTCGTAT CTGATGCTGG 34 80 

3S ATTGCC CTTA ATTAGTGATC CTGGATACGA ATTAGTAGTG GCAGCCaGAG AAGCTAATAT 354 0 

TAAAGTAGAG ACTGTGCCTG GACCTAATGC TGGGCTGACG GCTTTGATGG CTAGTGGATT 3600 

ACCTTCATAT GTATATACAT TTTTAGGATT TTTGCCACGA AAAGAGAAAG AAAAAAGTGC 3660 

40 TGTATTAGAG CAACGTATGC ATGAAAATAG CACATTAATT ATATACGAAT CACCGCATCG 3720 

TGTGACAGAT ACATTAAAAA CAATTGCAAA GATAGATGCA ACACGACAAG TATCACTAGG 3780 

GCGTGAATTA ACTAAGAAGT TCGAACAAAT TGTAACTGAT GATGTAACAC AATTACAAGC 3840 

45 

ATTGATTCAG CAAGGCGATG TACCATTGAA AGGCGAATTC GTTATCTTAA TTGAAGGTGC 3900 

TAAAGCGAAC AATGAGATAT CGTGGTTTGA TGATTTATCT ATCAATGAGC ATGTTGATCA 3960 

TT AT ATT CAA ACTTCACAGA TGAAACCAAA ACAAGCTATT AAAAAAGTTG CTGAAGAACG 4020 

50 

ACAACTTAAA ACGAATGAAG TATATAATAT TTATCATCAA ATAAGTTAAT CACTTTATCG 4080 

ATTaTATGAA ATTTTAAACG ATTTTATAAA CGCAAGCTGT AATTTTAAAT GGTAAGTTAT 4140 

55 
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GTTTTTTAAT GTAAAATAAA TACATTGAAA GTAATAAATA CCTTAACATT GAATAAGATG 4260 

AAAATGAGAT GACGAGATAA ATGTTCGCGT CCGTTGAAAT GCATAGAAAT CTTAGATATT 4320 

5 

ATTTGAAGTG AGACATTACG AGGAGGAACA GTTATGGCTA AAGAAACATT TTATATAACA 43 80 

ACCCCAATAT ACTATCCTAG TGGGAATTTA CATATAGGAC ATGCATATTC TACAGTGGCT 4440 

GGAGATGTTA TTGCAAGATA TAAGAGAATG CAAGGATATG ATGTTCGCTA TTTGACTGGA 4500 

10 

ACGGATGAAC ACGGTCAAAA AATTCAAGAA AAAGCTCAAA AAGCTGGTAA GACAGAAATT 4560 

GAATATTTGG ATGAGATGAT TGCTGGAATt AAACAATTGT GGGCTAAGCT TGAAATTTCA 4620 

1£ AATGATGATT TTATCAGAAC AACTGAAGAA CGTCATAAAC ATGTCGTTGA GCAAGTGTTT 4680 

GAACGTTTAT TAAAGCAAGG TGATATCTAT TTAGGTGAAT ATGAAGGTTG GTATTCTGTT 4740 

CCGGATGAAA CATACTATAC AGAGTCACAA TTAGTAGACC CACAATACGA AAACGGTAAA 4800 

20 ATTATTGGTG GCAAAAGTCC AGATTCTGGA CACGAAGTTG AACTAGTTAA AGAAGAAAGT 4860 

TATTTCTTTA ATATTAGTAA ATATACAGAC CGTTTATTAG AGTTCTATGA CCAAAATCCA 4920 

GATTTTATAC AACCACCATC AAGAAAAAAT GAAATGATTA ACAACTTCAT TAAACCAGGA r 4980 

25 

CTTGCTGATT TAGCTGTTTC TCGTACATCA TTTAACTGGG GTGTCCATGT TCCGTCTAAT 5040 

. CCAAAACATG TTGTTTATGT TTGGATTGAT GCGTTAGTTA ACTATATTTC AGCATTAGGC 5100 

TATTTATCAG ATGATGAGTC ACTATTTAAC AAATACTGGC CAG CAGAT AT TCATTTAATG 5160 

30 

GCTAAGGAAA TTGTGCGATT CCACTCAATT ATTTGGCCTA TTTTATTGAT GGCATTAGAC 5220 

TTACCGTTAC CTAAAAAAGT CTTTGCACAT GGTTGGATTT TGATGAAAGA TGGAAAAATG 5280 

55 AGTAAATCTA AAGGTAATGT CGTAGACCCT AATATTTTAA TTGATCGCTA TGGTTTAGAT 5340 

GCTACACGTT ATTATCTAAT GCGTGAATTA CCATTTGGTT CAGATGGCGT ATTTACACCT 5400 

GAAGCATTTG TTGAGCGTAC AAATTTCGAT CTAGCAAATG ACTTAGGTAA CTTAGTAAAC 5460 

40 CGTACGATTT CTATGGTTAA TAAGTACTTT GATGGCGAAT TACCAGCGTA TCAAGGTCCA 5520 

CTTCATGAAT TAGATGAAGA AATGGAAGCT ATGGCTTTAG AAACAGTGAA AAGCTACACT 5580 

GAAAGCATGG AAAGTTTGCA ATTTTCTGTG GCATTATCTA CGGTATGGAA GTTTATTAGT 5640 

45 

AGAACGAATA AGTATATTGA CGAAACAACG CCTTGGGTAT TAGCTAAGGA CGATAGCCAA 5700 

AAAGATATGT TAGGCAATGT AATGGCTCAC TTAGTTGAAA ATATTCGTTA TGCAGCTGTA 5760 

TTATTACGTC CATTCTTAAC ACATGCGCCG AAAGAGATTT TTGAACAATT GAACATTAAC 5820 

50 

AATCCTCAAT TTATGGAATT TAGTAGTTTA GAGCAATATG GTGTGCTTAA TGAGTCAATT 5880 

ATGGTTACTG GGCAACCTAA ACCTATTTTC CCAAGATTGG ATAGCGAcGG AnAATTGCAT 5940 

55 
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AACCTCAAAT TGATATTAAA GACTTTGATA AAGTTGAAAT TAAGGCAGCA ACGATTATTG 6060 
ATGCTGAACA TGTTAAGAAG TCAGATAAGC TTTTAAAAAT TCAAGTAGAC TTAGATTCTG 6120 

5 

AACAAAGACA AATTGTATCA GGAATTGCCA AATTCTATAC ACCAGATGAT ATTATTGGTA 6180 
AAAAAGTAGC AGTTGTTACT AACCTGAAAC CAGCTAAATT AATGGGACAA AAATCTGAAG 6240 

GTATGATATT ATCTGCTGAA AAAGATGGTG TATTAACCTT AGTAAGTTTA CCAAGTGCAA 6300 

10 

TTCCAAATGG TGCAGTGATT AAATAACTGT ATTTTTAAAA ATTAGGAGAG ATAATTATGT 6360 

TAATCGATAC ACATGTCCAT TTAAATGATG AGCAATACGA TGATGATTTG AGTGAAGTGA 6420 

1$ TTACACG^GC TAGAGAAGCA GGTGTTGATC GTATGTTTGT AGTTGGTTTT AACAAATCGA 6480 

CAATTGAACG CGCGATGAAA TTAATCGATG AGTATGATTT TTTATATGGC ATTATCGGTT 6540 

GGCATCCAGT TGACGCAATT GATTTTACAG AAGAACACTT GGAATGGATT GAATCTTTAG 6600 

20 CTCAGCATCC AAAAGTGATT GGTATTGGTG AAATGGGATT AGATTATCAC TGGGATAAAT 6660 

CTCCTGCAGA TGTTCAAAAG GAAGTTTTTA GAAAGCAAAT TGCTTTAGCT AAGCGTTTGA 6720 

AGTTACCAAT TATCATTCAT AACCGTGAAG CAACTCAAOA CTGTATCGAT ATCTTATTGG 6780 

25 

AGGAGCATGC TGAAGAGGTA GGCGGGATTA TGCATAGCTT TAGTGGTTCT CCAGAAATTG 6840 

CAGATATTGT AACTAATAAG CTGAATTTTT ATATTTCATT AGGTGGACCT GTGACATTTA 6900 

AAAATGCTAA ACAGCCTAAA GAAGTTGCTA AG CATGTGTC AATGGAGCGT TTGCTAGTTG 6960 

30 

AAACCGATGC ACCGTATCTT TCGCCACATC CGTATAGAGG GAAGCGAAAT GAACCGGOGA 7020 

.GAGTAACTTT AGTAGCTGAA CAAATTGCTG AATTAAAAGG CTTATCTTAT GAAGAAGTGT 7080 

35 GCGAACAAAC AACTAAAAAT GCAGAGAAAT TGTTTAATTT AAATTCATAA AGTTAAAAGT 714 0 

GAGAAAGATC ACCGCCATAA ATGTAAACGA TGCTATATTC GTTTAATATG CTATGGTTCT 7200 

TTCTCACTTT TTTAAATTAA AATATCGTGC ATGTGGAATA CGTGCGATAG AGATGGTTAG 7260 

40 AGCTTTGAAA TTAAGAATTG TAGGAAGGCG TTTTAAATGA AAATCAATGA GTTTATAGTT 7320 

GTAGAAGGAC GAGATGATAC TGAGCGTGTT AAACGAGCTG TTGAATGTGA TACGATTGAA 7380 

ACGAATGGTA GTGCCATCAA CGAACAAACT TTAGAAGTAA TTAGAAATGC TCAACAAAGT 7440 

45 

CGAGGCGTTA TTGTATTAAC AGATCCAGAT TTCCCAGGAG ATAAAATTAG AAGTACAATT 7500 

ACTGAACATG TCAAAGGTGT TAAACATGCG TATATTGATA GAGAAAAAGC TAAAAATAAA 7560 

AAAGGGAAAA TTGGTGTTGA ACATGCCGAC TTAATTGATA TTAAAGAAGC GTTAATGCAT 7620 

50 

GTTAGTTCAC CCTTTGATGA AGCTTATGAA TCAATTGATA AATCTGTGCT AATAGAGTTG 7680 

GGGTTAATTG TTGGGAAAGA TGCAAGGCGC CGTAGAGAAA TTTTAAGTAG AAAATTGCGA 7740 

55 
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GCGGATGTAA GGCAAGCTTT AGAAGATGAA TGAGGAAGTG AAAATOTTGG ATAATAAAGA 7860 

TATTGCAACA CCATCAAGAA CGCGAGCGTT GTTAGATAAA TATGGCTTTA ATTTTAAAAA 7920 

5 

AAGTTTAGGA CAGAACTTTT TGATAGATGT GAATATCATT AATAATATCA TTGATGCAAG 7980 

TGATATTGAT GCACAAACTG GGGTGATTGA AATTGGTCCA GGCATGGGGT CATTGACAGA 8040 

ACAATTGGCC AGACATGCTA AAAGAGTATT GGCATTTGAA ATTGATCAAC GTTTAATACC 8100 

10 

TGTATTAAAT GATACACTAT CACCTTATGA TAATGTGACG GTGATTAATG AAGATATTTT 8160 

AAAAGCGAAT ATTAAAGAAG CTGTTGAAAA TCATTTACAA GATTGTGAAA AAATAATGGT 8220 

15 TGTTGCAAAC CTGCCGTACT ATATTACGAC GCCAATTTTA TTAAATTTGA TGCAACAAGA 8280 

TATACCAATT GATGGCTACG TGGTGATGAT GCAAAAAGAA GTGGGOGAAC GCTTAAATGC 8340 

TGAAGTAGGT TCAAAAGCAT ATGGTTCGTT ATCAATTGTC GTACAATACT ATACAGAGAC 8400 

20 TAGTAAAGTA TTAACGGTAC CTAAATCTGT ATTTATGCCA CCACCTAATG TTGATTCAAT 8460 

AGTTGTAAAA CTGATGCAGA GAACTGAACC GTTAGTAACA GTAGATAACG AGGAAGCATT 8520 

CTTTAAGTTA GCAAAAGCAG CATTTGCACA AAGAAGAAAG ACAATTAACA ATAACTATCA 8580 

25 

AAATTATTTT AAAGATGGTA AACAACACAA AGAAGTGATT TTACAATGGT TGGAACAAGC 8640 

AGGTATTGAT CCAAGACGTC GCGGTGAAAC GCTATCTATT CAAGATTTTG CTAAATTGTA 8700 

TGAAGAAAAG AAAAAATTCC CTCAATTAGA AAATTAAATG ATTGACAAAG CAAAGCACTA 8760 

30 

TT G TTAAAAT TTAAATTTTG TTTGACGAAA ACGTTGCAAA TATGGTATTA TGTAACTTGT 8820 

AGCGAGGTGG AGCAATATGC CAAAATCAAT TTTGGACATC AAAAATTCTA TTGATTGTCA 88 8 0 

35 TGTAGGAAAT CGTATTGTAC TGAAaGCCAA TGGAGGCCGT AAGAaAACAA TAAAACGTTC 8 94 0 

TGGAATTTTA AAAGAAACAT ATCCGTCAGT TTTCATTGTT GAGTTAGATC AAGACAAACA 9000 

CAAQtTTGAG AGAGTATCTT ATACATACAC TGATGTGTTA ACTGaAAATG TTCAAGTTTC 9060 

40 ATTTGAAGAG GATAATCATC ACGAATCAAT TGCACACTAA ATAAGACATA TAGAGATGTT 9120 

AGACGTTTCT TAGTATAAGA AGTAAATATT ATGATAATTA TTTGAGTGTT GGGcATTATG 9180 

TTCAATACTC TTTTTATTTA CAAAATGTTT AACACTGATG TTTCGCTTAT AGATTTTTCA 9240 

45 

GTAAATGGAT AATTGTATTT ATAAACACAA ATACAAGTAA ATACTAAGTA ATTAGATGGA 93 00 

GAAAATTACT TTTTTATTAA AAAAACACTA AAAAACAAAT TAAAATGTCA AATATTAATT 9360 

CTCTTTATGT TAAAATCATC ATATTAAGAT AACGAAAAGA GGGCGGAAAA TGATATATGA 9420 

50 

AACGGCACCA GCCAAAATTA ATTTTACGCT CGATACACTT TTTAAAAGAA ATGATGGCTA 9480 

TCATGAGATT GAAATGATAA TGACAACAGT TGATTTAAAT GATCGTTTAA CTTTTCATAA 954 0 
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AAATCTCGCA TATCGTGCAG CGCAACTATT TATTOAGCAA TATCAACTAA AGCAAGGTGT 9660 

AACAATTTCT ATCGATAAAG AAATACCTGT TTCTGCTGGC TTAGCTGGAG GTTCGGCTGA 9720 

5 

TGCAGCAGCA ACGTTAAGAG GATTGAATCG ACTTTTTGAT ATAGGGGCGA GTTTGGAAGA 97 BO 

ATTGGCTCTA CTAGGCAGTA AAATCGGGAC AGATATTCCG TTTTGTATTT ATAATAAAAC 9840 

io TGCACTATGT ACTGGAAGAG GAGAGAAAAT CGAGTTTTTA AATAAACCAC CTTCAGCTTG 9900 

GGTGATTCTT GCTAAACCAA ACTTAGGCAT ATCATCACCA GATATATTTA AGTTGATTAA 9960 

TTTAGATAAG CGTTACGACG TACATACGAA AATGTGTTAT GAGGCCTTAG AAAATCGAGA 10020 

15 TTATCAACAA TTATGTCAAA GTTTGTCTAA TCGATTAGAG CCAATTTCTG TTTCAAAACA 10080 

CCCACAAATC GATAAATTAA AAAATAATAT GTTGAAAAGT GGTGCAGATG GTGCGTTAAT 1014 0 

GAGTGGAAGC GGACCTACTG TGTATGGGCT AGCACGAAAA GAAAGCCAAG CAAAAAATAT 10200 

20 TTATAATGCA GTTAACGGTT GTTGTAATGA AGTGTACTTA GTTAGACTAT TAGGATAGAA 10260 

GGGTTGAAAA GATGAGATAT AAACGAAGCG AGAGAATTGT TTTTATGACG CAATATTTGA 10320 

TG r 10322 

25 

(2) INFORMATION FOR SEQ ID NO; 99: 

(i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 5614 base pairs 

(B) TYPE: nucleic acid 
30 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

35 <xi> SEQUENCE DESCRIPTION: SEQ ID NO: 99: 



40 



45 



SO 



GATTGATTAA 


ATGTTTTAAT 


CCACTTCAAT 


GC CTTCGATA 


AACTCTACAA 


TCGCGCTATT 


60 


CATATAATTA 


TTCGATTTCA 


TTTGTTCAGC 


ATATGTCTCA 


TTAAATCCAG 


ACATAACTTT 


120 


TTTAAAwGCG 


AAAATTGAAA 


TTGGTATCGT 


TACTAATAAG 


GCACTAGCCA 


TACGCCAATC 


180 


AATGAGCATT 


ATGTATAAAA 


AGATAGCAGC 


TGACAAAAGT 


AAGTTTCCTA 


TAACTTCAGG 


240 


AATCATATGT 


GCTAAAGGTA 


ATTCTATTGT 


TTCAACCTTA 


TCGACAAATA 


TATTTTTTAA 


300 


TTCACCTATT 


TTCTTAGATT 


CCaCTACGCC 


TAAAGGGAGA 


CGCATTAATT 


TTTGAGCTAA 


360 


TTTTTTACGA 


ATTTCAGATA 


AAATTTCATA 


TGCCGTAATA 


TGTGATAGCA 


TCGTTGACGC 


420 


TCCAAAACAA 


CACACTTGTG 


AAATATAAGC 


GATTAAAGCA 


ATAAAGATAT 


AAACCATAAT 


480 


CGAATTAATC 


GTATATGTAT 


TGTTAAT CAT 


CATTAAAATA 


ATTTTAAATA 


CTGCCCAATA 


540 


AGGAACTAAT 


CCAGAAAAGA 


CACTGATGAT 


AGACAACAAA 


ATTGATAACA 


TAATTTTCCA 


600 
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ATATGTAACT CCTkTCAATT AATAATCTAA ATTAAGCCGC TTATATTATT TATTTCACTG 720 

GATQATATAC ATAATATAAA TTTGTTATTT GTTAAAAATT AATACTTATT ACAAGTACAT 780 

CATATATTAG TTGATAACGA TTATCAATGT CGCGTGGATT TGTGACACAT TTCTTTTAAA 840 

AATTCACAAG GTTATGGGGC AGAAATGATA AAGAGCCACT AATGATTTAT TATGTAGTGG 900 

TTCTGGGAGT GGGACAGAAA TGATATTTTC ACAAAATTTA TTTCGTCGTC CCACCCCAAC 960 

TTGCATTGTC TCTAGAAATT GGGAATCCAA TTTCTCTTTG TTGGGTCCCT GAATATAGCC 102 0 

TTGTAGAGTC TAGTACATTG ATTTGTATCC CAATGTCCCT ATAATTGATT ATTCGCTTTA 1080 

IS TCTAATGATC CTATGACTCA ACTATTAAAT CATTTTTCGA AATACTTAAT TCTAATATAA 1140 

TTAAATTCAT TTATTGTAAT ATTGCAAAAA TACATTGCAC ACCTTGTTCA TCAATGCTAT 1200 

AATTAATTAC ATAATAAATT GAACATCTAA ATACACCAAA TCCCCTCACT ACTGCCATAG 1260 

20 TGAGGGGATT TATTTAGGTG TTGGTTATTT GTCACCTTTT TTATTGTTGC GCGTTCGTAA 1320 

CCAATGTGCA AAAAACGCAA CAAGACAGCC GCTTATAGCT GAAGTCATGA TGTTAATTAA 1380 

TAAATTGAAC ATCCGTCATA CACCTCCTCT CTGCGTTAAA GTAACGCCOG AGATGTTAGG 144 0 

CGACCATCAT ATTATATCAT TTATTTATTA TATTTCACGC AATATTAAGG CTTAAGTAAA 1500 

GTTTTTTTTA GTGGTTTACG CTACTTTAAT TGCTATCTTT TAAAATCCAT TTAGATAATA 1560 

TAAATGTGAT GGGTATCGTA ATAATTAAAC CAGCAAATGG TGCAATTTCT GCTGGCAAAT 1620 

TTAGCCAGGA TACAAATACA TATAATAAAA CTGTTTGTAA GCTTACGTTG ACAATCTGCG 1680 

TAATTGGAAA ACTAATGAAT TTTCTCCAAG TAGGTTTTAC CCTGTAAACA AAATAACAAT 174 0 

35 TCAAATAATA TGAAATCACA AAAGCGACTA GAAATCCGGT AATATGACTA ATCATATATT 1800 

CAATGTGTAA TAATTTTAAC AGCAATAAAT AGACAACATA . ATAATTTAAC GTATTAATGC 1860 

CGCCAACAAT GATAAATTTT AAAATTTCAG CATGCGTTTG TGTTAGTTTC ATATGTGTAc 1920 

40 TCCTCAACAT CAAAATATAT GCATAACTAC GTTCTCGAAC ATACTCGAAT ATGCGAGCCA 1980 

ATCCGCTTCA CTTCAAATAT GCTTATTTCA ATCTTTATAC CCTTTCACAG CAAATTTAGT 204 0 

CTCTTTCCCC TCATCCTTAT ACGCCATTAT AATGTAACTG ATTTATCGCG TGACTCATTA 2100 

GCACTATAGA GATTACTTTA GTTCACTAGT AATTTTATAT ACAATAAGAG CGACAACAGT 216 0 

AATGAGAGGA TGTCTACTAT GCAATTACAA AAAATTGTCA TCGCTCCTGA CTCATTTAAG 2220 

GAAAGTATGA CCGCACAGCA AGTTGGCAAT ATTATAAAAC AGGCTTTTAC TAATGTTTAT 2280 

GGGAATACCC TTCATTATGA TATCATTCCG ATGGCTGATG GTGGTGAAGG TACCACAGAT 234 0 

GCTTT A ATGC ATGCAACAGG TGCCACTAAG TATACAGTCA TCGTTAATGA CCCTTTAATG 24 0 0 

55 
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GCGGCAGCGT 


CAGGTTTGGA 


TTTATTAGAA AAAGAGGAAC 


GTAATCCTTT 


ATACACATCA 


2520 




TCATATGGTA 


CCGGTGAACT 


AATTAAAGAT 


GCATTAAATC 


ATGGTGCTAA 


GACCATTATT 


2580 


5 


TTAGGGATTG 


GTGGCAGTGC 


AACAAATGAT 


GGTGGTACAG 


GTATGCTAAG 


TGCACTAGGC 


2640 




GTAAAGTTTA 


CTGATGTAAA 


CGGGGACTTA 


TTACAAATGA ATGGTGCTAA 


TCTTGCTCAC 


2700 




ATTGCACAAA 


TCGATATAAC 


CAATCTAGAT 


TCGCGATTAA 


AAGAGGTGAC 


CTTTAAAGTG 


2760 


10 


GCCTGTGATG 


TTTCAAATCC 


TTTATTGGGT 


GAAAATGGTG 


CTACCTATAT 


TTATGGTCCT 


2820 




CAAAAAGGCG 


CTGATGCAAA 


GATGATACCA 


AAGTTGGATT 


TCGCAATGTC 


GCATTATCAT 


2880 


1S 


GATAAGATAA 


AAATGTGCAC 


AGGAAAGTCC 


GTTAATCAAA 


TACCAGGTTC 


TGGTGCAGCT 


2940 


GGCGGTATGG 


GCGCAGCATT 


ATTAGCGTTT 


TGTGAGACAA 


CTTTAACAAA 


AGGTATTGAT 


3000 




GTCGTCTTTG 


ACATTACAGA 


TTTTCATCAA AGAATTAAAG 


ATGCAGACCT 


CGTTATTACT 


3060 


20 


GGAGAAGGAC 


GCATGGATTA 


TCAGACCATC 


TTTGGTAAAA 


CACCCGTAGG 


CGTTGCGTTA 


3120 




GCTGCAAAAC 


AATATCATAT 


TCCTGTCATC 


GCGATTTGTG 


GCAGTCTAGG 


CGAAAATTAT 


3180 




CAACATGTTT 


ACGATTTCGG 


TATTGATAGT 


GCCTATTCTA 


TAATCTCTTC 


ACCTAGCACT 


3240 


2S 


TTAGAAGATG 


TCCTACAAAA 


TAGCGAACAA 


AATTTATTAA 


ACACTGCAAC 


TGACATTGCT 


3300 




CGTATTCTGA 


AATTACAATA 


ATGTCAAAGT 


AAATCATCAG 


CTTTATTATT 


TGCAGTTAAA 


3360 




ACTTGAATGA 


GGTGAAACCC 


ATGAAAAGAA 


CTGATAAATA 


CCGTGATTCA 


TATCAATACG 


3420 


30 


ACAATCAAAA 


CCAAAATCAT 


CGTCGTCAAT 


CTGAAGACGC 


ATCGTATAGA 


CAACAATATG 


3480 




CTAAAGG CGA 


TCCTGAAGAA 


CACCCGGAAC 


GATACTATAA 


TGGTAGAGAT 


TATCGAAGAG 


3540 


OS 


AACAAATTCT 


TGAAGAAGAA 


AACGAGAAAT 


CCCGCCGTTC 


AAAAAAATGG 


TTATATATCA 


3600 


. TT ATTG C CAT 


TCTCTTAATT 


ATTGTCGCTA 


TTTTTGTCAC 


ACGCGCCTTA 


CTTAACAATG 


3660 




ATAGtGATAA 


AGTTAGTAAT 


GACCCTAAAG 


TCTCTCAAAA 


TTATAAAAAA 


CAAGTTGAAA 


3720 


40 


ATCAAGACGG 


CCAAATTAAC 


CAGCAAGTAG 


ATAATGCTAA 


AGAAAATATT 


AAAAACAACC 


3780 




AAAAAACTGA 


TGACATTATT 


AAAAATTTAC 


AAAATCAAAT 


CGACAACTTG 


AAGCAGCAAG 


3840 




AACAAAACAA 


AGCTGATTCT 


AAGCTAACTC 


AATTTTATCA 


AGACCAAATC 


AACAAATTGA 


3900 


4$ 


CAGAGGCAAA 


TAATGCACTT 


AAAAACAATG 


CAAGCCAAGG 


TAAAATTGAA 


AGCATGTTAA 


3960 




ATGATATTAA 


TACAAAATTC 


GACAGTATTA 


AATCTAAATT 


AGAAAGCTTA 


TTTAAAGATG 


4020 




ACAATGGTGG 


CGCTAATTAA 


TTATTACACC 


TGCTTTGATG 


ATAAACATTA 


ATTCCCTATA 


4080 


SO 


CTTTATCTGT 


ATCACTACGT 


TATTCGTGAT 


GATGCATTAA 


GAGTATAGGG 


ATTTTTTATA 


4140 




TAAACTTGTA 


TTCTAACTAC 


ATACAAATAC 


ACACAAAACG 


TATATAATTT 


ATATAATTAT 


4200 



55 
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TTATTGCTAA TTACGTTAGG CGTCATGACC GCTTTTGGCC CACTAACTAT AGATATGTAC 4320 

GTACCATCAT TACCTAAAGT GCAAGGTGAT TTTGGTTCTA CTACATCAGA AATTCAATTA 43 80 

ACATTATCAT TCACAATGAT TGGTCTTGCA CTAGGCCAAT TTATCTTTGG ACCTTTATCC 4440 

GATGCTTTTG GTCGCAAACG GATTGCTGTA TCCATTTTGA TCATTTTCAT TTTGGTATCA 4500 

GGTTTGTCTA TGTTTGTTGA TCAATTGCCA TTATTCTTAA CTTTACGATT TATTCAAGGT 4560 

TTAACTGGTG GTGGCGTCAT CGTGATTGCA AAAGCCTCTG CTGGTGATAA ATTTAGTGGC 4620 

AACGCACTCG CTAAATTTTT AGCATCTTTA ATGGTAGTTA ATGGCATCAT CACTATTCTT 4680 

GCACCATTAG CCGGTGGATT AGCTTTATCC GTAGCAACAT GGCGTTCTAT TTTCACAATT 4740 

TTAACTATTG TGGCACTCAT CATTTTAATT GGCGTCGCTT CTCAATTACC TAAAACATCT 4800 

AAAGATGAAT TAAAGCAGGT GAATTTTAGT AGCGTCATTA AAGATTTTGG AAGTCTTTTG 4860 

2Q AAAAAACCAG CATTTATTAT TCCAATGCTA TTACAAGGwT TAACTTATGT AATGCTATTT 4920 

AGTTATTCAT CTGCATCGCC ATTTATTACT CAAAAATTGT ATAATATGAC ACCCCAACAA 4980 

TTTAGTATCA TGTTTGCTGT TAACGGTGTA GGTTTAATCA TTGTCAGTCA AGTCGTTGCT 504 0 

25 TTATTAGTAG AAAAATTACA TCGCCACATA TTATTAATCA TTTTAACTAT TATACAAGTG 5100 

GTAGGTGTTG CTTTAATTAT CCTGACACTT ACATTCCATT TACCACTTTG GGTCTTACTC 5160 

ATCGCATTCT TCTTAAATGT GTGTCCTGTG ACGTCAATTG GACCGCTTGG TTTCACAATG 5220 

GCTATGGAAG AACGAACAGG TGG CAGTGGT AACGCATCAA GTTTACTTGG CTTATTCCAA 5280 

TTTATCTTAG GTGGCGCTGT TGCACCATTA GTTGGCTTAA AAGGCGAATT TAATACATCA 5340 

CCATATATGA TTATTATCTT CATTACAGCC ATTCTATTAG TCAGTCTACA AATCATTTAC 5400 

TTTAAAATGA TTAAAAAGCA ACATGTCGCA TAACACTTCA ACATAATTAG AACCCTAGCA 5460 

AAGA^ATCTA TCTTTGTCAG GGTTCTTCTT TATGAATTAT GAGATCGAAT CTTCAACTAA 5520 

AATTACGCCT TCATAGCAAG GACATTTCTA TTCAATCACC CTTTAACAGG CATCCAAATT 5580 

TcTGTAATAT ATTTTTCACT TGTAGTATCA CCAT 5614 
(2) INFORMATION FOR SEQ ID NO: 100: 

45 <i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 9179 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



30 



35 



40 



SO 



55 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 100: 
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AAAGACAATG ATATGAAGTA TATOGATATC ACAGAaAAAG TGCCAATGTC GGAATCTGAA 12 0 

GTTAACCAAT TGCTAAAAGG TAAGGGGATT TTAGAAAATC GAGGGAAAGT TTTTCTAGAA 180 

GCTCAAGAAA AATATGAGGT TAATGTCATT TATCTTGTTA GCCATGCATT AGTAGAAACA 240 

GGTAACGGCA AATCAGAATT AGCAAAAGGC ATTAAAGATG GGAAAAAACG CTATTACAAC 3 00 

TTTTTTGGTA TAGGAGCATT CGATAGTAGT GCTGTTCGTA GTGGGAAAAG TTATGCTGAA 360 

AAGGAACAAT GGACATCACC AGATAAGGCG ATTATTGGTG GTGCAAAGTT CATTCGTAAT 4 20 

GAATATTTTG AAAACAATCA ACTGAATTTA TATCAAATGC GATGGAATCC AGAAAATCCT 4 90 

GCGCAACATC AATATGCGAG TGACATTCGC TGGGCAGATA AAATTGCCAA ATTAATGGAT 54 0 

AAATCCTATA AGCAGTTTGG TATAAAGAAA GATGATATTA GACAAACATA TTATAAATAA 600 

GACATCGGTG CTTAAAGGAG CTGGAACAAT TTATTGTTTC GAGCTCCTTT AGCGCATTCT 660 

20 GAGTGTGTTA GTTAAATGGA TTTTAACCTA ACAAAAAACG CTATATAGCA TCAAATATGC 720 

TATATCCCAC ATCATTGTTA CAAATGTACA TGATGTAAAT GAATATTGCT GTCTAAATGT 780 

GCATGTAATA TACAATGGTG CAGATAATAC ACTTAAGTCC TTAAAAATGA AACGTTAgTT 840 

25 CCAAGAGTCA TTTTTAAACA ATAGTGCATG TGATAAAATA GAAAAGAATG AAAAATATAG 900 

AGGTGACAAT ATGAAGATAG CAATTATAGG TGCAGGCATC GGTGGATTAA CAGCTGCTGC 960 

ATTATTACAA GAACAAGGTC ATACTATTAA AGTCTTTGAA AAAAATGAGT CAGTTAAAGA 1020 

AATTGGCGCT GGGATTGGTA TCGGAGATAA TGTG CTTAAA AAACTAGGTA ATCATGACTT 108 0 

AGCTAAAGGT ATTAAAAATG CTGGGCAAAT CTTATCTACA ATGACAGTGT TAGATGACAA 1140 

AGATGGCCTG TTAACTACTG TTAAATTAAA AAGTAATACA TTGAATGTGA CGTTACCACG 1200 

CCAAACATTA ATTGACATTA TTAAATCTTA TGTAAAAGAT GACGCAATAT TTACAAATGA 1260 

TGAAGTCACG CATATAGATA ATGAGACAGA TAAAGTTACC ATACATTTCG CGGAACAAGA 1320 

AAGTGAAGCA TTTGATTTAT GTATTGGTGC TGATGGAATT CATTCTAAAG TGAGACAATC 13 80 

TGTAAATGCT GACAGTAAAG TATTATATCA AGGGTATACA TGCTTTAGAG GTTTAATTGA 1440 

TGATATTGAT TTAAAG CATC CGGaTTGTGC AAAAGAATAC TGGGGaAGAA AAGGaAGAGT 1500 

45 AGGTATTGTT CCGTTATTAA ATAATCAAGC ATATTGGTTC ATTACAATTA ACTCGAAGGA 1560 

AAACAATCAT AAATATAGTT CGTTTGGTAA ACCTCATTTG CAAGCATACT TTAATCACTA 1620 

TCCAAATGAA GTTAGAGAGA TCTTAGACAA ACAAAGTGAA ACAGGTATCT TATTGCATAA 1680 

SO 

TATTTATGAT TTGAAACCAC TCAAATCTTT TGTTTATGGT CGTACTATTT TACTAGGAGA 174 0 

TGCAGCACAT GCGACAACGC CTAATATGGG GCAAGGTGCT GGACAAGCAA TGGAAGATGC 18 00 

SS 
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10 



TAAAATACGT GTCAAACATA CTGCAAAAGT AATTAAGCGT TCTAGAAAAA TCGGTAAAAT 1920 

TGCCCAATAT CGTAGTCGTT TATTTGTTGC AGTTAGAAAT CGTATTATGA AAATGATGCC 1980 

AAATGCATTA GCAGCTGGAC AAACTAAATT CTTATATAAA TCGAAAGAAA AATAATACAA 2040 

CAATATGAAA ACCCCCGTAT GTTGAAACGA GAGCTCAACA TATGGGGGTT CTTGTTTTTA 2100 

TAATGTTATT ATAATAAATT CAATTATTAG TTAACGACAA ATTGTGGTTT CTCACCTTGA 2160 

ACGGCACTAA TTGCAGCATT AGCAACAATT TTAGACATCA TGTCACGTGC TTCAAATGTA 2220 

GCATTACCAA TATGCGGTGT TAATACTACA TTATTAAGTG ATTTTAAGTC ATCGGTAATA 2280 

15 TCTGGTTCAA ATTCATATAC ATCAAGTGCA GCACCTTCAA TTTCATTATC TTTCAATGCT 2340 

TGCACTAGTG CTTGTTCGTG CACGATTGGA CCACGAGAGG CATTGATTAA ATACGCCGTA 2400 

GATTTCATCA TTTTAAATTG TTCTGTATCA ATTAAATGAT GCATTTTAGG ATTATAAGCA 2460 

20 GCGTTGATAG TGATAAAATC TGCATTCTTT AATAGTGTAT CTAAATCTAC ATATTTTGCA 2520 

CCGATTTCTC GTTCTTTTTC TTCTTTGCGA TTAGGTCCAG TGTATAGCAC ATCCATGTCA 2580 

AATGCTCTTG CACGACGAGC TACTGCACTA CCAATTTCAC CTAAACCGAT AATGCCGATT 2640 

GTTTTCCCAG ATACTTCTCT ACCTCTGAAA AATAAAGGTG CCCATCCATC AAATCCAGTT 2700 

GTAOGTGATA ATTGGTCCCC TTCAACAATA CGACGCGCTA CTGCAAGTAC TAATCCAATT 2760 

GTTAAATCAG CAGTCGCGTT TGTTGATGCT TTAGGTGTGT TTGTAACATC TATACTTTTT 2820 

TCTCGGGCAT ACTCGATATC AATATTATTA AAACCAGCGC CATAGTTGGC AATGATTTTT 2880 

AAGTCTTTAC CAGCATCGAT AACATCTTTA TCAACGTTTG TAGATAATAA ACTAATTAAG 294 0 

GCAGTCGCGT TTTTAACACC TTTAATTAAA GTGTCTTTAT CGACTAATCC TTTACCTTCA 3000 

TACATTTCAA CTTCAAAATG TTCTTGTAAA AGTTTTAAAC CTACTTCTGG TATtGCACCA 3060 

gCAACATAAm CTTTTtCCAT AAAAGAtCAC TCCTTTTATC TTAGTATAGT AGAAGATTAG 3120 

40 ACAGTATACA ACTATGTCAT GATGTCTTGT GTATCAATGA TGTAAGCGCG TACTTTTGAT 3180 

GGAGGCGATA TAACTTAGGC ACTGTAGAAC TATGAATATT GTAATGTGGA AAAACTGGAT 324 0 

CAATTAAATT AGATAACGTA GTTTTAAAGT TAATAGTATT AGAAAAAATT AATATTTTGA 3300 

ATATGGGAGG AAATATAAAT AAGTAGGTGG CAACGAAAAA TAGCAAAAAA AGAGCTTCTC 3360 

CTATAAAGGA AAGCTCAAAG TTTTTTGATG ACATATGTAC TAGAATTAAG TTTCAAGACA 3420 

ATATGTATCA TCGTGTTTAT ATTAAATATG GATGTAGTTG TAGTTACCTG CTTCACTTGC 3480 

AGAAATAGTT CTAGAACTTA CTGAGAAAGG TCCGCCACTA TAATTCATTT CTGAAATTGT 3 54 0 

AACTGAACCA TCACTGTTTA CACTTTCTAC AT ATG CAACG TGACCAAATG GTCCTTCAGA 3600 

ss 
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AGCAGCAGCC 


CAATTATTAG 


CATTTCCCCA 


AGTAGAACCG 


ATTTCTCCGC 


CAACTTTATC 


3720 




ATATACATAC 


CAAGTACATT 


GTCCTGCAGT 


GTATAAGTTA 


CCAGAATGTG 


AAATTGATGA 


3780 


5 


TGTAGTTGTC 


GTAGTTGTCG 


TAGTCGTTQT 


AGTTTGAGTC 


GTGTTGTAGT 


TATAGTTGTT 


3840 




GTAATTTGTA 


TAATTTTCAG 


CAGCATCTGC 


ATGATGTGCT 


TGACCTACTA 


ATGCTGTGCC 


3900 


10 


GATTCCTGCT 


GTTAACGTAG 


TTGCTGTTAC 


TAATTTTTTC 


ATGAATAAAG 


TCCTCCAAAG 


3960 


TTCTATATCT 


TTTTTTATAA 


ATAAAACGTA 


GCGACTGTTT 


TATTCTCACA 


TCTCGAATTG 


4020 




ATGACAATAG 


TTACTTTAAC 


AAAATtAATG 


cTTCTTGTGG 


GGAATGTTAT 


TGATTTGTAA 


4080 


15 


AAGAATAAAA AAACTTTGAC 


TAATTTTGTA 


ATAAAAATTA 


GTCAAAGTTA 


CAATGAGATT 


4140 




AACAGATAAT 


TAATAGGAAA 


TATTTATTTG 


TAATATGTTT 


AAATAAATCG 


AATTGTTAAA 


4200 




GGTATTATAT 


ATTCTTGGCC 


ATTATAATAT 


TTGACACACG 


CAATAATTGT 


GAATACAAAA 


4260 


20 


GATAATATTG 


AGAAAGCGAA 


TATGGATAAA 


ATACCGATAA 


ACGTAATGAT 


GAAACCTATA 


4320 




ATAATAATGA 


AATCAATATC 


TGTAGCAATT 


AGGAAAACGC 


CTATTAAAGT 


GATAACGACT 


4380 




AAAACGATAG 


ACCAAATAAT 


ATAAGAAATC 


GTATAGTTAA 


GATAATTTTT 


TCCAGCACGA 


4440 


25 


TCAACTAGTT 


TCGATTCATC 


TTTTTTCAAT 


AACCATATTA 


TCAGTGGACC 


AATAATAGAT 


4500 




GTGAATAAAC 


TTAATAAATA 


GATAAGCATC 


GCCATAATGT 


TCTCATCATT 


GGATTTGCGA 


4560 


ou 


TTCGGTTGAT 


GATTTGTTAC 


GTCGTTCATT 


TCAGTTGTCA 


TATTAGACAC 


TCCTTTGAAA 


4620 


ATTGTAATAT 


TATCTTTAAC 


TATAACAAAA 


TATAATCAAA 


AATAAACATG 


TTTATTAAAC 


4680 




AATTATTAAA 


AATAAAAATA 


ATTGGTGGAC 


GTCGGCGTTT 


AAATAGGTTA 


ATTTAAGGTT 


4740 


35 


ATATATACTT 


AACATTTATA 


ATGATGCGTA 


ATGAATTCGC 


AT CATTTTT A 


TATTGTCTTA 


4800 




CGTATAATTT 


GTTTTTAATT 


TTAACCAAAG 


ATAGAAAGAG 


GGTTGTTTAT 


GAAAATAGCA 


4860 




ATTGTAGGAT 


CAGGAAATGG 


CGCAGTTACG 


GCAGCAGTAG 


ATATGGTGAG 


CAAAGGCCAC 


4920 


40 


GATGTTAAAT 


TATATTGTCG 


TAATCAATCT 


ATAAGTAAGT 


TTCAAAACGC 


AATCGAAAAG 


4980 




GGCGGATTTG 


ATTTTAATAA 


TGAAGGTGAT 


GAACGTTTCG 


TAAAATTCAC 


TGATATTAGT 


5040 




GATGATATGG 


AATATGTTTT 


AAAAGATGCT 


GAAATTGTTC 


AAGTGATTAr 


TCCATCTTCA 


5100 


45 


TACATAGAGT 


ATTATGCTGA 


TGTAATGGCA 


GAGCATGTAA 


CTGATAATCA 


GTTGATATTC 


5160 




TTCAACATGG 


CTGCAGCAAT 


GGGGTCAATT 


CGTTTTATGA 


ATGTTTTAGA 


AGATAGACAT 


5220 




ATTGAAACAA AACCACAACT AGCGGAAgcT AATACGTTGA CGTATGGTAC GCGTGTCGAT 


5280 


50 


TTTGAAAATG 


CAG CAGTTGA 


TTTATCTCTA 


AATGTACGTC 


GTATCTTCTT 


TTCAACATAT 


5340 




GATAGAAGCT 


GTCTAAATGA 


TTGTTATGAC 


AAAGTTTCAA 


GTATTTATGA 


TCATTTAGTA 


5400 



55 
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CCAACATTAT 


TGAATGTCGG 


TCGCATTGAT 


TATGCTGGOG 


AGTTCGCTTT 


ATATAAAGAA 


5520 




GGAATTACTA AACATACAGT 


TAGATTACTT 


CATGCAATCG 


AATTAGAACG 


TTTGAATTTA 


5580 


5 


GGCCGTAGAT 


TAGGTTTTGA ATTATCAACA 


GCTAAAGAAT 


CACGTATTGA 


ACGTGGTTAT 


5640 




TTAGAACGTG 


ATAAAGAAGA 


TGAACCATTA 


AATCGTTTGT 


TTAATACAAG 


CCCAGTATTT 


5700 


10 


TCACAAATTC 


CAGGACCAAA 


TCATGTAGAA 


AGCAGATATT 


TAACTGAAGA 


TATTGCATAT 


5760 


GGTTTAGTAC 


TATGGTCAAG 


CTTAGGTCGT 


GTTATTGATG 


TACCGACACC 


AAATATAGAT 


5820 




GCAGXAATTG 


TAATTGCATC 


AACCATTTTA 


GAGAGAGACT 


TCTTTGAGGA 


AGGCTTAACA 


5880 


15 


GTTGAAGAAA 


TTGGTTTAGA 


TAAGCTTGAT 


TTAGAAAAAT 


ATTTAAAATA 

& A A ******** A *r& 


AATGATGGCT 


594 0 




TGAAGATAGA AAAGGATATA 


GCATTATGCA 


AAAGCAATAA 


ATTGAAGAAA 


#*va*»wvj x x x \» x 


6000 




CATCAATAAG 


CGnAGGGGAC 


GATAGATGAT 


GAAAAGAAAA 


CCCACCTTTT 

V»wV»f*^wX X X A 


t Art a ATr* a at 

X *l\J**f"V X X 




20 


TTCGACAATG 


ATTGTAATGCJ 


TTATTGTTGT 




X X luluil X X 


X XvvilnliUv, 


f i on 
© x.^u 




AATTCAAGTA 


TTATTAATTA 


TTGCCTCAGC 


ATAiYscpApa 


XV7VjnX luV^nn 


>*MWV3 X\j lALAi 


OXttU 




CTTAAGATGG 


CAAGATTTAG 


AAAAAGGCAT 




TTAAATACTG 


CAATGCCTGC 


Ox4U 


25 


AAXTTTAATT 


ATACTAGCGG 


TAGGAATTAT 




TGGATGTTTT 


CTGGCACAGT 


€300 




GCCAGCCTTG 


ATTTATTATG 


GCTTAGATTT 


ATTGAATCCA 


AGCTATTTTT 


TAATATCAGC 


6360 




CTTTTTTATA 


AGTGCTGTTA 


CAT CTGTAGC 


AACTGGTACA 


GCATGGGGCT 


CTGCATCAAC 


6420 


30 


TGCAGGGATT 


GCACTTATTT 


CTATTGGTAA 


TCAATTGGGG 


ATTCCTCCAG GGATGGCAGC 


£ a q n 




GGGTGCTATT 


ATAGCAGGGG 


CTGTGTTTGG 


CGATAAAATG 


TCACCATTAT 


CAGATACAAC 




35 


TAATTTAGCG 


GCGCTTGTTA 


CTAAAGTTAA 


T AT ATTTAAA CATATACATT 


CGATGATGTG 


Cfftft 

oouu 


GACGACGATA 


CCTGCATCAA 


TCATAGGTTT 


ATTAGTATGG 


TTTATTGCTG GATTTCAATT 


DDOU 




TAAAGGGCAT 


TCAAATGATA 


AACAGATTCA 


AACTTTGTTA 


TCAGAGCTTG 


CACAGATTTA 


6720 


40 


TCAAATTAAC 


ATATGGGTCT 


VjVjVj i. X X X 


AATTGTGATC 


ATTGTTTGTT 


TGCTATTTAA 


6780 




AATGGCTACA 


GTGCCAGGTA 


TGCTAATATC 


AAGCTTTTCT 


GCCATTATAG 


TGGGGACTTT 


6840 




TAATCATCAT 


TTCAAAATGA 


CAGATGGTTT 


CAAAGCAACA 


TTTAGTGGTT 


TTAACGAATC 


6900 


45 


AATGATACAT 


CAGTCTCATA 


TTTCATCCAG 


TGTGAAAAGC 


TTGTTAGAAC 


AGGGTGGTAT 


6960 




GATGAGTATG 


ACCCAAATAT 


TAGTAACGAT 


ATTTTGCGGA 


TATGCATTTG 


CAGGTATTGT 


7020 




AGAAAAAGCA 


GGATGTTTAG 


AAGTCTTATT 


AACTACTATT 


TCTAAAGGCA 


TCCATTCTGT 


7080 


50 


AGGAAGTTTA 


ATATGTATTA 


CTGTTATTTG 


TTGTATTGCG 


CTTGTATTOG 


CTGCAGGTGT 


7140 




TGCTTCGATT 


GTAATTATTA 


TGGTCGGTGT 


GTTAATGAAA 


GATTTGTTCG 


AAAAATACCA 


7200 
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20 



25 



30 



35 



40 



45 
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AATACCATGG 


GGAACATCAG 


GTATTTACTA 


TACGAATCAA 


CTTCATGTCT 


CTGTTGAAGA 


7320 


ATTTTTCATA 


TGOACAGTAC 


CATGTTATTT 


ATGCGCAATT 


ATAGCAATTA 


TCTATGGTTT 


7380 


TACAGGGATA 


GGTATTAAAA 


AGTCATCGAA 


TTCACGTTTA 


ACTTAATGTG 


AGCGTGGAAT 


7440 


ATATATAATA 


TGTTGAAACA 


CTTTAATCAT 


TTATAATTGT 


AGCGGTTATA 


ATTTGAAAAG 


7500 


GTTTTAACTT 


AGAATAAATA 


TCCTCTATGC 


ATATACTGAA 


TATGTTTTGT 


AGCGGAACAT 


7560 


GTTGATATAT 


GTAATGTAAG 


TTTTATGTCA 


TGATTTGTAA 


TGACTAAATT 


AATTGAGAAT 


7620 


TTGAAGGCAA 


GTATATTTGT 


AAGTACTTTA 


ACTAAAAATT 


TATCAATGTA 


TAGCCGATTT 


7680 


GACATGCCTA 


AATTTGGGTG 


TGTCAATGGC 


TGTATGTTGT 


TTATTCTTTA 


TTACAGAGTG 


7740 


AATCGGATTG 


GTGAAAATCG 


AAATTTTGAG 


ATTTTTACCA 


ATTCGATTTT 


TTTCATAGAA 


7800 


ATTAAAAAAG 


CCAACAAGGC 


TCTTGAAACC 


TTGTTGGCGT 


AAACATAGCC 


ATCACTAATT 


7860 


AGTGAATGAA 


GTTATAACCA 


GCAGCTTGGC 


TAGCTGAGAT 


TGTACGTGAA 


GTTACAACAC 


7920 


CTGGGCCATA 


ACCATAGTTC 


ATTTCTGAAA 


CTCTTACTGA 


ACCATTGCTG 


TTAACACTTT 


N 7980 


CAACGTATGC 


AACGTGACCG 


TATGCACCTT 


GAGTTGTTTG 


CATAATTGCA 


CCAGCTTTTG 


8040 


GTGTATTGTT 


CACTGTGTAA 


CCAGCTCTTG 


CAGCTGCGTT 


AGCCCAGTTA 


CTTGCATTGC 


8100 


C CCAAGTTG A 


ACCGATTTTA 


CCACCTACAC 


GATCAAATAC 


GTAGTATGTA 


CATTGACCAG 


8160 


AAGTGTATAA 


GTTACGTCCT 


GAAGTATAAC 


CACTTGAGAT 


TGAACGGCCA 


TTTGATGATG 


8220 


GAGCCATAGT 


TGTAGTTACT 


TGAACATTGT 


TGCTTGAAGT 


GCTGTAGCTT 


GCACCTAAAC 


8280 


CACCAGTACG 


GTAG CTGTTT 


GTGTTGTAAC 


TATTATAGTT 


ATTGTAGTTA 


TATGATTGAT 


8340 


TATTATTTGA 


GTAGTTGTTG 


TAACGGCTGT 


AGTTATTGTA 


GCTATAACCG 


TTGTTGTAAT 


8400 


TGTTATAGTT 


ATTGTAACCA 


TTGTAGTAGT 


AATAGCTGTA 


GTAGCCATTA 


TCTTGGTTTA 


8460 


ATTGACTTGG 


ATGCCAGTTA 


CCTTTCCATG 


TGTAATGGTA 


GTTACCTTGT 


GCATCAATAG 


8520 


TGTAAGTATA 


GCTATATGAT 


GTTGGGTCGT 


TTGGATTATA 


ACCGTAGTTA 


TCTTGCTCAG 


8580 


AAGCATGAGC 


TTGATTTCCT 


GATGCAATTG 


CGATTGTAGC 


GAATCCTGCA 


GTTGCGATAG 


8640 


TAGCTGTAGC 


GATTTTCTTC 


ATTTTAAAAA 


TATCCTCCTA 


AAAATTTTAA 


ATCTAAAATA 


8700 


TTTTCGTAAT 


GTCCGTGTGA 


CAAAATTAAT 


GTTATAAGTT 


ATCTCTCGTA 


ATTAAACGAC 


8760 


AAGAAAGACT 


ATAACAGAAA 


TTAGCGTCCT 


TGTGTGCTTT 


GTTAACGTTT 


TGTAATTTTT 


8820 


TGCTAATATC 


TTGACACAAT 


AGAATTTTAA 


AAGTATAGAA 


ATTTGCATTT 


TGCAAAACTT 


8880 


ATAACTACGG 


CATTCTTTGT 


GAAAACTGAA 


TGTTTCGAAA 


ATAAGTCTGT 


TACAAATTTG 


8940 


TAATATTACT 


GAAAATTCTA 


AATGTATATT 


TTGTGCATAA 


TATAGGACTT 


TTAATCAGAA 


9000 
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GGATGAAAAT GTATATTTAA TGGATAAAAT ATCCTAATTT AGCATAAAAA AATGTTTTAA 9120 
TAAAAGTATT ATTTGATATA ATCGATTTAT GTTTTGTTAC TGCTAAAAAA CATGTGGCG 9179 
5 (2) INFORMATION FOR SEQ ID NO: 101: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: I860 base pairs 

(B) TYPE: nucleic acid 
10 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 101: 

1S 



20 



3S 



40 



CCTTCAGCCA 


TTTGACTTCG 


ACATGAGTTG 


CCTGTACATA 


TAAAATAAAT 


TGTTTTTTTA 


60 


GTCATAACAA 


TCTCCTAATT 


AATTAAAATA 


TGATAAGTGT 


TAGATACAAC 


CCTATGAGGG 


120 


TTATAAATAG 


TACTGGAATT 


GTAATGATGA 


TACCAGTTTT 


AAAGTATGTG 


CCCCAAGAAA 


180 


TCTTAACATC 


TTTTTGtGTT 


AAGACGTGTA 


ACCACAGTAA 


TGTAGCTAAA 


GAGCCTATCG 


240 


GTGTAATTTT 


TGGACCTAAA 


TCAGAACCGA 


TAACATTCGC 


ATAAATTAGG 


CCTTCTTTTA 


300 


ACATGCCATG 


GACATTTGAT 


TGACCAATAG 


CAATOGCATC 


TATTAAAACT 


GTAGGCATAT 


360 


TATTCATTAT 


TGATGATAAA 


AACGCTGAAA 


TGAAGCCCAT 


TCCCAAAATA 


GTGCTAAATA 


420 


GACCGTAATT 


GGAAATATAT 


TCTAATATTT 


TAGCCAATAT 


TAAAGTAATG 


CCAGCATTTC 


480 


TTAAGCCGAA 


TACGACGATA 


TACATACCAA 


TTGAAAATAA 


TACTATATTC 


CAAGGTGCGC 


540 


CCTTAATGAC 


TTGCTTAATA 


TTTACAGCAT 


TTGATTTACG 


AGC CAACATT 


AGAAAAATAA 


600 


AAGCAATGAT 


TCCAGTGAAA 


ATTGATACCG 


GAATTTTAGT 


AAATTTACTG 


ATTAGATAGC 


660 


CGAAAAGTAA 


TATAACTAGA 


ACAATCCaTG 


AAATTTTAAA 


• TAGCTTTAAA 


TCATTAATGG 


720 


CATCFTTAGG 


ATGCTTTATA 


TTATTATCAT 


CAAACGTTTT 


AGGTATCGCT 


TTTCTAAAAT 


780 


ATAACCACAA 


TACTATAATA 


CTTGCTAAAA 


GCGAGAATAA 


ATTAGGTATA 


ATCATTCTAC 


840 


TAAAATATCG 


AACGAATCCT 


ACATGAAAAT 


AATCAGCAGA 


TATAATATTC 


ACTAGATTGC 


900 


TCACGATTAA 


AGGTAAAGAA 


GTTGTGTCAG 


CTATAAAACC 


ACTCGCAATA 


ATnAAAGGGA 


960 


ATATGGCCCG 


CTTACTAAAA 


CCTATATTTT 


TAACCATCGC 


TAATACAATA 


GGCGTTAAGA 


1020 


TTAAcGTGCG 


CCATCATTTG 


CGAAAAATGC 


AGCAACAATG 


GCACCCAATA 


ATATGATATA . 


1080 


AACGAACATT 


TTTAAACCAT 


TGCCTTTTGA 


AGCATGAAGC 


ATGTGAATAG 


CTGACCATTC 


1140 


GAATAATCCA 


ACTTTATCTA 


ATATTAATGA 


AATAAGAATG 


ACTGAGACAA 


AAGTCAAAGT 


l 1200 


AGCATTCCAA 


ACAATACCTG 


TTACTTCGAA 


AACATCGGAA 


AAACTTACAA 


CACCAGTAAT 


1260 
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TAATACAAAT AATAAAGTTA CTAGAAAAAT GAGTGTCGCT AAAGTTGTCA TCATTAGCAT 1380 

TCACCAGTCT TAAGGTTATG ACAAATACAT CGTTGGTTAG AGGTATGAAC CTTAGACAAG 1440 

5 TTATTAATTA CGGACTCAAA AATATTATGA TTgAGCTGGT ATAAATGTTT ATTTCCGATT IS 00 

TTTCGTGTCG TAACTAAGTT GGTTTTTACT AATGCTTTCA TATGrTAGCT AAGTGTAGGT 1560 

TGAGAGAATT GAAAATGTGC TAACAAATCA CAAGCGCATA ACTCTCCACA AGAAAGTAAA 1620 

10 

TCTAGTATTT CTAATCTGCT TGAATCTGAT AAAACTTTTA AAAATGTTGC TAGTTCTTTA 1680 

TACGTCATAA CATACCTCCT AGACGTTAAA TAGATTATCA TCTATATAGA TGAATGTCTA 1740 

15 TGTTCCTTTG GTATATTACA CGATATGACT ATGTAATTTA AATTTGGTTT TAGTATTAAA 1800 

AGGGTATTAA AGATAAATTA TAGATATTGA TTTTGCAAAA TATACTCTTT GTTCTGCATT 1860 

GAAAAAGG 1B68 

20 (2) INFORMATION FOR SEQ ID NO: 102: 

<i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 15249 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
25 <D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 102: 

30 



35 



40 



45 



SO 



ATTTATGAAA 


TCCATAGCnA 


TAAACATTAT 


TCTTGCATCG 


GCTATACAAA 


CAGTTACCGC 


60 


AAGCAAATTT 


GTATATCAAC 


CTGGAATTGT 


GTTCACGTCA 


ATGGCaAATG 


CCGATGATGT 


120 


GTTATCAGGC 


GATAGTTATT 


TTATGGCTGA 


ATTAAAATCT 


ATTAAGCGTA 


TTGTTGAAAT 


180 


TCCAGATAAT 


CAAAAAATAT 


ACTGCTTTAT 


AGATGAAATT 


TTTAAAGGTA 


CCAACACAAC 


240 


TGAACGAATT 


GCCGCTTCAG 


AATCAGTACT 


ATCATTTTTA 


CATGAAAAAT 


CTAACTTTAG 


300 


AGTTATTGCA 


GCAACACATG 


ATATTGAGTT 


AGCTGAACTC 


TTAAAACAAC 


GTTATGAAAA 


360 


TTACCATTTC 


AATGAGGTAA 


TAGAAAATAA 


TAACATACAT 


TTTGATTACA 


AAATTAAGCC 


420 


TGGCAAAGCA 


AATACACGTA 


ATGCCATCGA 


ATTATTAAAA 


ATCACTTCAT 


TTCCAGCAAA 


480 


AATATATGAA 


CGAGCAAAAG 


ATAATGTCCC 


GAAAATTTAG 


CATTTAACTT 


TAAACATAAA 


540 


AACGTCAGCT 


ATCACATGAC 


AGAAGACTAT 


GAACAGTTTC 


AATAATGTTC 


ATAGTAATCA 


600 


TGTTAATAAC 


TGACGTTTAT 


TTTATTCTGC 


AGAATACTCT 


TCTAAATCTA 


TATTGCTGTG 


660 


CCCATTTAAT 


GCTAAATCAG 


CAAATCGACC 


TTGCTGATAC 


AAATAGTGGC 


CGGCAACGCC 


720 


TATCATTGCA 


GCATTATCTG 


TGCATAATTT 


AGGACTTGGG 


ATAGTTAATT 


GAATGTCATT 


780 
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AACAATTAAT CGCTGAACAC CATATTCTTT 
CTCTACAACA CTGTTTTGAA AGCTOGTTGC 
5 TTGTOGTTGA TTGTGAAGTT GATTGATTAC 

ATAACTATCT TTATCCAACC AAACACGAGG 
CAACCGATCA ACTTGTGGAC CACCTGGATA 

10 

ATAAOCCTCA CCTACTGCGT CATCTOGTGT 
CTTCATATAA ACTAATTCAG TATGTCCACC 

15 TAATGGCTCT TCTATGTGAT TAGCATATAT 

TGGCTnATCG TAAGCAAATG CCAATGCTTT 
AATTAGTCCA GGGCCTTCTG TAACCGCTAT 

20 ATCCCCTAGA GCCTCGTTTA TTGTTGCTGT 

TTCGGGAACG ACACCGCCAA ATCGTTTATG 
TAAAATATCT CTGCCATTTT TTATAACACT 

26 AGCTAGTATT AATATATCTT TAGTCATTTA 

CTTCACCATA ATAATTTTTA CGTTTACCAC 
GTTGTGCCAC TTTATTATTA ACTCTTACTT 

30 

CATAGTTTAT TCCGTATTTT AAAAGCATTT 
COATTGCAAC TGTTGTAATT TGAGCTTGAT 
TAATTTGTTG TTCAAATTCt AAGACAAAAT 

35 

GATAAAATGC GTCAATTGTC CAAGAACTGT 
cttqTggcac ATCTTCTTTA GTCATCTCTC 

40 CCAATTTCGT TCCGCCTCAG CTAATTTATG 

AGGTTTATCT AGCAATTGAT ACATGACTGA 
TTGTAATTCA TCTTGTAATT TTACAGTATC 

45 ATCTTCTAAA AAAGCTCGCA ATGCCTCTAT 

TAATTGACCA TTTTGCCACT GGAATATGCC 
CACAGGAACC AATAATTTAT CAGTATGATC 

SO 

AACACCATAT AATTTAACAT CTAACG CATA 
ACGTAAGCCA GTATATGAAC CAGGACCTTC 

55 



ACAAGCTTGA ATAGCTTTAA ACGTGAGCAC 900 

TACGTTAGCT TCAATGATTG GaATATTTTT 960 

GGCACTTTTC AACC CACTAA AACTAAAATC 1020 

GAATGAATAA GTATCTTCAC CTTCAGCAGC 1080 

ATTTAAACCA ATTGTTCGTG CCACTTTATC 1140 

TTCACCAATG ACTTCAAATG ATAAATGATC 1200 

TGAAACAATA AGTGCAATTA GCGGGAATGT 1260 

ATGTCCTGCA ATATGATOAA CAGGAATAAG 1320 

GGCTGCATTA ACACCTATTA GTAACGCACC 1380 

GGCATCAATA TCTTCTATTG ATACATCGGC 1440 

TATACCTTCA ACGTGATGTC TACTTGCCAC 1500 

ACTTTCAATC TGACTTAAAA CTGTATTTGA 1560 

AACGCTTGTT TCATCACAAC TTGTTTcAAC 1620 

AATTCACCCA CATAACCATT GCGTCCTCAC 1680 

CATATTGAAA TCCTAAATTT TCATATACAT 1740 

CTAAACTCAT CACATCACAA GTGTGACTTG 1800 

GACCTAAACC ATAGCCTCTA TAATTATCAT 1860 

CGATAACAAT CCATAAACCT AAATAACCAA 1920 

ATTTCGCAAA GTTATTTTGC TCTATTTCAT 1980 

CATTGAAACT CCGACGCTCA AGATCAAAGA 2040 

TAATGTTTAA TTGTTCTTTT GACTGTTGAT 2100 

GTATTTAGGA GTAAATGTAT GTACGTCTGA 2160 

TGCATTTGGT AGctGCGCAA TCACTTCACC 2220 

TTTCC CAAT A TAAATAAATG GTTGGTTTAA 2280 

CGACATATAT TGATCTTCTA AAATAGTCAC 2340 

TGTATAAACT GCTTGTOGTC TTGCATCAAA 2400 

GATTGTTGCT GCCAATGCCT TTAATGATGA 2460 

CGCTAATGTT TTAGCAACAG TAACACCGAT 2520 

AGCAACAATA ATCGCATCTA ATTGCTGTTT 2580 
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